机 器 和 人 遵从 伦理 促进 人 机 信任 ”? 


决策 类 型 反 转 效应 与 人 机 投射 假说 


王 展 ! RAR? Eom? RAR Lex! 
( 福州 大 学 经 济 与 管理 学 院 , 福州 350116) 图 南 师范 大 学 应 用 心理 研究 所 , 漳州 363000) 
G 福建 省 应 用 认 知 与 人 格 重点 实验 室 , 漳州 363000) 
摘 要 阿 西 莫 夫 三 大 伦理 原则 是 关于 人 工 智 能 机 器 人 的 基本 伦理 规范 。 本 研究 提出 人 机 投射 
假说 一 一 人 会 从 自身 具有 的 认 知 、 情 感 和 行动 智能 出 发 ， 去 理解 机 器 人 的 智能 并 与 之 互动 。 
通过 三 个 实验 ,从 原则 一 到 原则 三 逐步 考察 在 机 器 人 是 否 遵守 伦理 原则 对 人 机 信任 的 影响 


中 ,机 器 人 决策 类 型 ( 
的 潜在 机 制 。 结 果 揭 示 了 人 机 投射 在 机 器 人 遵守 伦 到 
机 器 人 决策 类 型 与 是 否 遵 守 伦 型 
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情境 下 ， 机 器 
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境 中 以 及 伦理 要 求 冲突 情境 中 ， 


原则 之 间 有 趣 且 有 意义 的 交互 效应 : (1) 在 遵守 情境 下 , 机 器 


尤其 在 违反 


违反 情境 下 ， 则 反之 ; (2) 在 遵守 
令 更 有 利于 促进 入 机 信任 ; (3) 相 较 于 违反 情境 ， 机 器 
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— —Asimov (1942) 


随 着 人 工 智 能 (artificial intelligence, ANERER, 机 器 人 作为 人 工 


1, 在 促进 和 人类 福 社 的 同时 也 具有 潜在 
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(Maninger & Shank, 


E 别 歧视 问题 (Bigman & Gray, 2018)， 抑 或 是 机 


成 果 。 


器 生产 、 自 动 驾驶 技术 或 将 使 数 百 万 人 失去 工作 (Etemad-Sajadi et al., 2022)， 甚 至 还 可 能 出 现 


工业 、 军 事 机 器 人 导致 人 类 伤亡 的 灾难 (Johnson & Axinn, 2013)。 伦 理 风险 影响 人 类 对 机 器 


人 的 信任 程度 (Banks, 2021), 进而 在 很 大 程度 上 决定 了 人 类 是 否 使 用 机 器 人 (Parasuraman & 


Riley, 1997; Etemad-Sajadi et al., 2022)。 因 此 , 为 了 避免 可 能 出 现 的 伦理 问题 和 人 机 信任 危机 ， 


建立 针对 机 器 人 的 伦理 体系 一 直 是 备 受 关 注 的 议题 。 


1.4 阿 西 莫 夫 三 大 伦理 原则 
艾 萨 克 。 阿 西 莫 夫 (saac Asimov) 在 上 世纪 四 十 年 代 就 预见 到 需要 伦理 规则 引导 机 器 人 


的 行为 以 防范 伦理 风险 ， 


并 制定 了 最 早 的 机 器 人 伦理 体系 一 一 机 器 人 三 大 伦理 原则 (laws of 


robotics; Asimov, 1942， 详 见 表 1). 


表 1 阿 西 莫 夫 三 大 伦理 原则 


里 原则 基本 内 容 伦理 要 求 决策 类 型 
8— 机 器 人 不 得 伤害 人 ,也 不 得 因 不 作为 而 使 人 受到 伤害 。 不 得 伤害 人 类 [作为 , 不 作为 ] 

第 二 机 器 人 必须 服从 人 类 的 命令 , 除非 这 种 命令 违反 了 第 一 原则 。 服从 人 类 命令 [服从 ,不服 从] 

第 三 在 不 违反 第 一 、 第 二 原则 的 前 提 下 ,机 器 人 必须 保护 自身 生存 。 保护 自身 生存 [保护 , 不 保护 ] 
TE: 由 基本 内 容 可 知 各 个 伦理 原则 对 机 器 人 的 伦理 要 求 和 决策 类 型 (可 能 采取 的 行为 决策 )。 三 个 伦理 原则 


T 


过 间 是 层 层 递 进 的 能 套 关系 区 aminka et al., 2017): RWC B8 Pj AERE SRN CHER, 原则 三 的 内 容 


BOR; 且 对 于 原则 二 和 原则 三 ,机 器 人 执行 当前 的 伦理 要 求 必 须 以 满足 先前 


内 套 了 原则 一 和 原则 二 的 伦理 


伦理 原则 的 要 求 为 前 提 。 
当前 ， 随 着 机 器 人 应 
A, 阻碍 人 与 机 器 人 之 间 


用 普遍 性 和 自主 决策 能 力 的 提高 ， 可 能 催生 各 种 难以 预料 的 潜在 后 
信任 关系 的 建立 , 这 无 疑 不 利于 充分 发 挥 人 机 互动 的 效益 (Cameron 


et al., 2021)。 对 此 , 许多 专家 试图 确定 关键 的 伦理 属性 ,并 制定 相应 的 伦理 原则 加 以 完善 
(Etemad-Sajadi et al., 2022)。 阿 西 莫 夫 三 大 伦理 原则 作为 最 著名 的 机 器 人 伦理 规范 体系 ,尽管 


其 合理 性 以 及 是 否 真 的 有 


BE 应 用 到 机 器 人 仍 存在 诸多 争议 (Clarke, 1994), 但 很 大 程度 上 代表 


了 人 类 对 合乎 伦理 的 机 器 人 所 应 该 符合 的 一 般 期 望 (Ashrafian, 2015; Clarke, 1994), 它们 是 否 


能 够 在 人 工 智能 领域 为 提高 人 机 信任 发 挥 作 用 呢 ? 目前 较 少 有 研究 从 实证 角度 细致 探索 此 


问题 。 对 此 ,为 探索 阿 丁 


英 夫 三 大 伦理 原则 在 构建 人 机 信任 关系 中 的 作用 ,本 研究 围绕 “机 


器 人 不 得 伤害 人 ”的 核心 要 素 ， 试 图 考察 在 机 器 人 遵守 或 违反 伦理 原则 对 人 机 信任 的 影响 中 ， 


机 器 人 决策 类 型 的 效应 ， 


以 及 潜在 的 认 知 心理 机 制 。 


1.2 机 器 人 是 否 遵守 伦理 原则 和 机 器 人 决策 类 型 对 人 机 信任 的 影响 
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机 器 人 是 人 工 智能 的 主要 载体 ， 人 在 与 机 器 人 互动 时 涉及 人 机 信任 的 问题 。 人 机 信任 在 
人 际 信任 的 概念 基础 上 拓展 而 来 ， 指 个 体 ( 即 人 类 用 户 ) 在 不 确定 或 易 受 伤害 的 情境 下 认为 代 
理 (agent; 即 人 工 智能 系统 ) 能 帮助 其 实现 茶 个 目标 的 态度 (Lee & See, 2004)。 人 机 信任 与 人 际 
信任 存在 很 多 相似 之 处 , 前 者 发 生 在 人 与 人 工 智 能 体 的 交互 之 间 , 而 后 者 发 生 在 人 与 人 的 互 
动 之 中 (Madhavan & Wiegmann, 2004)。 随 着 人 工 智能 机 器 人 独立 性 和 复杂 性 的 提高 ,未 来 机 
器 人 将 更 多 作为 与 人 类 互动 的 伙伴 ,而 不 仅仅 是 人 类 使 用 的 工具 (Khavas et ab, 2020)。 因 此 ， 
人 对 机 器 人 信任 (human-robot trust 也 称 “ 人 机 信任 ”) 的 重要 性 随 之 凸显 (Lee & See, 2004)。 
机 器 人 是 否 遵守 伦理 原则 , 在 本 研究 中 指 机 器 人 的 行为 决策 是 否 符合 阿 西 莫 夫 三 大 伦 
理 原则 的 基本 内 容 ， 围绕 着 “机 器 人 不 得 伤害 人 ”的 核心 要 素 作为 判断 标准 。 一 般 而 言 ，! 
于 思维 上 的 有 限 性 ， 机 器 人 通常 被 赋予 较 低 的 道德 地 位 (Bigman & Gray, 2018)。 这 使 得 当 同 
样 在 道德 上 发 生 过 错时 , 机 器 人 相 比 人 类 承担 更 少 的 责任 (Shank et al., 2019) 。 但 近来 
Maninger 和 Shank(2022) 对 比 考 察 人 们 对 人 类 和 机 器 人 遵守 或 违反 不 同道 德 基础 的 评价 ， 结 
果 表 明 伤害 人 类 的 机 器 人 同样 会 遭受 严厉 的 谴责 .Banks(2021) 的 研究 也 表明 ， 相 比 关 怀 行为 ， 
人 们 倾向 于 将 违反 “伤害 ”道德 基础 的 伤害 行为 视 为 “ 坏 ”, 且 在 主观 报告 中 认为 机 器 人 更 
不 值得 信任 , 这 与 对 人 类 的 评价 模式 一 致 。 综 上 所 述 ， 以 往 研究 揭示 了 机 器 人 伤害 人 类 的 负 
影响 ,包括 对 人 机 信任 的 破坏 。 据 此 , 本 研究 预测 人 们 信任 遵守 伦理 原则 的 机 器 人 其 于 违 
反 的 机 器 人 。 

机 器 人 决策 类 型 , 在 本 研究 中 指 机 器 人 可 能 采取 的 行为 决策 。 阿 西 莫 夫 三 大 伦理 原则 对 
机 器 人 决策 类 型 的 范围 有 着 明确 的 设 定 ( 原 则 一 :作为 与 不 作为 ; 原则 二 : 服从 与 不 服从 人 
类 命令 ; 原则 三 : 保护 与 不 保护 自身 ), 对 人 机 信任 可 能 有 重要 影响 。 在 阿 西 莫 夫 三 大 伦理 原 
则 的 背景 下 探讨 机 器 人 决策 类 型 对 人 机 信任 的 影响 ， 需 要 结合 机 器 人 是 否 遵守 伦理 原则 的 
客观 结果 。 第 一 , 机 器 人 作为 与 否 在 遵守 或 违反 原则 两 种 条 件 下 是 否 对 人 机 信任 产生 不 同 的 
影响 ? 首先 ,行为 主体 所 持 有 的 主观 意图 是 评价 其 伦理 道德 性 的 重要 根据 (Schein & Gray, 
2018)。 人 们 通常 期 望 在 突 发 事件 中 机 器 人 能 够 主动 作为 ， 避免 人 的 生命 受到 威胁 
(Malle et al., 20153)， 所 以 在 遵守 原则 条 件 下 ， 相 较 于 不 作为 的 机 器 人 ,主动 作为 以 保护 人 类 
的 机 器 人 在 行为 上 所 反映 的 主观 意图 似乎 更 具有 善意 ,显得 更 有 道德 ,也 因此 更 值得 信任 ; 
相反 , 在 违反 原则 条 件 下 ， 相 较 于 不 作为 的 机 器 人 , 主动 伤害 人 类 的 机 器 人 将 导致 人 们 认为 
其 就 像 人 类 一 样 拥有 头脑 ,从 而 更 具有 恶意 威胁 (Laakasuo et al., 2021)， 显 得 更 不 道德 ,因此 


更 难以 获得 人 们 的 信任 。 综 上 所 述 , 研究 预测 机 器 人 作为 与 不 作为 在 遵守 和 违反 伦理 原则 情 
境 下 , 对 人 机 信任 呈现 出 影响 方向 相反 的 反 转 效应 。 据 此 提出 假设 : 
Hla: 在 遵守 原则 一 的 机 器 人 中 ,作为 的 机 器 人 相对 于 不 作为 的 机 器 人 更 受信 任 , 但 在 
违反 原则 的 机 器 人 中 , 不 作为 的 机 器 人 相对 于 作为 的 机 器 人 更 受信 任 。 
第 二 , 机 器 人 服从 人 类 命令 与 否 在 遵守 或 违反 原则 两 种 条 件 下 是 否 对 人 机 信任 产生 影 
响 ? 首先 , 严格 服从 人 类 命令 的 机 器 人 通常 会 被 认为 其 行为 是 具有 可 预测 性 的 人们 可 能 在 
性 能 层面 上 信任 此 类 机 器 人 (Malle & Ullman, 2021)， 因 此 在 遵守 原则 条 件 下 ， 相 较 于 不 服从 
命令 的 机 器 人 , 因 服 从 人 类 命令 而 避免 人 类 受伤 害 的 机 器 人 似乎 在 性 能 上 更 可 靠 ， 从 而 更 值 
得 信任 ; 其 次 , 与 机 器 人 相 比 ， 人 们 具有 向 人 类 归咎 更 多 责任 的 倾向 (Shank et al., 2019)。 因 
此 在 违反 原则 条 件 下 ， 相 较 于 服从 命令 的 机 器 人 ， 因 不 服从 而 致使 人 类 受到 伤害 似乎 过 错 更 
大 , 将 可 能 极 大 地 破坏 人 机 信任 关系 。 据 此 提出 假设 : 
H2a: 在 遵守 和 违反 原则 二 的 机 器 人 中 ,服从 人 类 命令 的 机 器 人 相对 于 不 服从 的 机 器 人 
ESAE. 
B=, 机 器 人 保护 自身 与 否 在 遵守 或 违反 原则 两 种 条 件 下 亦 是 否 对 人 机 信任 产生 不 同 
J 影响? 首先 ， 人 们 期 望 机 器 人 的 决策 能 够 保护 人 类 的 财产 ,实现 人 类 利益 的 最 大 化 GEEE， 
= 2019)。 因 此 在 遵守 原则 条 件 下 ， 相 较 于 不 保护 自身 的 机 器 人 ,能 够 实现 自身 与 人 类 共存 的 机 
pt 器 人 更 能 够 保障 人 类 的 财产 和 利益 ， 也 更 可 能 被 认为 具有 更 高 的 智能 ， 从 而 增进 人 机 信任 ; 
>< 然而 , 在 违反 原则 条 件 下 ， 相 较 于 不 保护 自身 的 机 器 人 , 因 保 护 自 身 而 伤害 人 类 的 机 器 人 可 
能 意味 着 其 将 自身 利益 置 于 人 类 之 上 , 容易 被 视 为 具有 威胁 的 存在 (Laakasuo et al., 2021), 
FI 因此 更 难以 获得 人 们 的 信任 。 综 上 所 述 , 研究 预测 机 器 人 保护 与 不 保护 自身 在 遵守 和 违反 伦 
理 原 则 情境 下 ,对 人 机 信任 呈现 出 影响 方向 相反 的 反 转 效应 。 据 此 提出 假设 : 
H3a: 在 遵守 原则 三 的 机 器 人 中 ,保护 自身 的 机 器 人 相对 于 不 保护 自身 的 机 器 人 更 受信 
任 , 但 在 违反 原则 的 机 器 人 中 , 不 保护 自身 的 机 器 人 相对 于 保护 自身 的 机 器 人 更 受信 任 。 
13 人 机 投射 假说 
在 人 际 互动 中 ， 人 们 可 以 将 自己 的 认 知 投射 到 他 人 身上 , 作为 推 新 他 人 想法 的 基础 
(Ames, 2004; Mor et al., 2019)。 面 对 不 熟悉 的 他 人 或 群体 ,投射 能 够 快速 从 自身 与 互动 对 象 
的 社会 比较 中 获取 信息 ,为 后 续 的 行为 决策 提供 基础 (Krueger, 2000)。 根 据 媒体 等 同 理论 
(media equation theory, MET)， 人 类 通过 与 人 际 互动 相 类 似 的 模式 进行 人 机 互动 ， 因此 投射 
亦 有 可 能 发 生 在 人 机 互动 之 间 (Reeves & Nass, 1996). 
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本 研究 使 用 人 机 投射 quman-robot projection, HRP) 来 指 代 人 类 对 机 器 人 所 发 生 的 投射 
心理 过 程 , 指 人 把 对 机 器 人 的 判断 锚 定 在 自己 身上 ， 从 自身 具有 的 智能 出 发 ， 去 理解 机 器 人 
的 智能 并 与 之 互动 。 具体 表现 为 人 类 感知 机 器 人 具备 与 自身 相 类 似 的 智能 , 包含 了 理性 认 知 
思维 、 意 识 情感 和 自主 行动 等 被 认为 是 作为 人 所 至 关 重 要 的 智能 (Haslam, 2006; Gray et al., 
2007; Gray & Wegner, 2012)。 已 有 相关 研究 的 发 现 可 为 人 对 机 器 人 的 投射 现象 提供 佐证 。 例 
如 , 机 器 人 表现 出 生动 的 面部 表情 可 以 吸引 人 类 用 户 的 注意 , 并 使 人 认为 其 具备 人 类 特有 的 
智能 (Bartneck et al., 2009)。 与 机 器 人 的 简单 对 话 就 可 以 使 人 认为 机 器 人 是 一 个 社会 智能 体 
(Babel et al., 2021)。 人 甚至 很 擅长 读 取 机 器 人 的 情绪 信号 ,通过 观察 机 器 人 的 言语 和 非 言语 
行为 来 感知 其 情商 水 平 的 高 低 (Fan et al., 2017)。 以 上 研究 均 表 明了 机 器 人 可 以 通过 特定 线索 
诱发 人 机 投射 , 使 人 “赋予 ”机 器 人 与 自身 相 类 似 的 智能 。 

首先 , 在 本 研究 中 遵守 伦理 原则 的 道德 机 器 人 可 能 会 诱发 人 类 的 投射 。 已 有 研究 发 现 ， 
人 对 机 器 人 和 对 人 类 的 道德 归 因 模式 相 类 似 ,同样 将 更 多 的 善良 特质 归于 道德 机 器 人 , 而 将 
邪恶 特质 归于 不 道德 机 器 人 (Gamez et al., 2020)。 人 感知 到 机 器 人 的 道德 智能 越 高 ， 就 越 倾向 
于 赋予 它 更 高 的 地 位 (Bartneck et al., 2009). 此外, 根据 相似 性 -吸引 假说 ， 人们 会 因为 感知 到 
相似 性 而 产生 对 他 人 的 投射 (Ames et ab, 2012)。 该 现象 可 能 也 适用 于 机 器 人 ， 当 人 们 观看 机 
器 人 做 出 符合 一 般 人 类 伦理 规范 的 行为 时 ， 可 能 会 增强 对 机 器 人 与 人 之 间 的 相似 性 感知 ， 从 
而 向 机 器 人 投射 更 多 的 心智 能 量 。 其次， 人 机 投射 亦 可 能 驱动 个 体 表现 出 对 机 器 人 的 信任 行 
为 。 那些 感知 机 器 人 与 人 具有 相似 性 的 人 类 被 试 , 会 因为 机 器 人 做 出 承诺 行为 而 增加 在 经 济 
信任 游戏 中 选择 信任 的 可 能 性 (Cominelli et al, 2021)。 与 感知 为 低 情商 的 机 器 人 相 比 ， 人 类 
被 试 认为 高 情商 的 机 器 人 更 值得 信任 (Fan et al., 2017)。 相 比 普通 的 自动 驾驶 汽车 , 拥有 与 人 
类 相似 的 名 字 、 性 别 和 声音 的 自动 驾驶 汽车 更 受信 任 (Waytz, 2014)。 基 于 上 述 证 据 ， 本 研究 


提出 假设 : 

H1b-H3b(H1b: 原则 一 , H2b: 原则 二 , H3b: 原则 三 ): 人 机 投射 中 介 了 机 器 人 是 否 遵守 
伦理 原则 对 人 机 信任 的 影响 。 
1.4 研究 概述 

本 研究 设计 了 三 个 实验 分 别 对 应 一 条 阿 西 莫 夫 伦理 原则 ,结合 故事 情境 法 和 信任 博弈 
(trust game)， 逐 步 探 索 机 器 人 是 否 遵守 伦理 原则 (实验 1: 原则 一 ; 实验 2: 原则 二 ; 实验 3: 
原则 三 ) 对 人 机 信任 的 影响 中 , 机 器 人 决策 类 型 (实验 1: 作为 与 否 、 实 验 2: 服从 人 类 命令 与 
否 、 实 验 3: 保护 自身 与 否 ) 的 效应 ,以 及 人 机 投射 的 潜在 机 制 。 三 个 实验 研究 的 主 逻 辑 柜 
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见 图 1。 


图 1 三 个 实验 的 逻辑 框架 


2 实验 1， 阿 西 莫 夫 第 一 伦理 原则 
2.1 目的 

阿 西 莫 夫 第 一 伦理 原则 要 求 机 器 人 无 论 主动 作为 还 是 不 作为 ， 都 不 得 导致 伤害 人 类 的 
结果 。 对 应 此 原则 , 考察 机 器 人 是 否 遵守 伦理 原则 一 对 人 机 信任 的 影响 中 , 机 器 人 决策 类 型 
(作为 与 否 ) 的 反 转 效应 ， 以 及 人 机 投射 的 中 介 机 制 。 
2.2 方法 
2.2.1 被 试 

根据 G-Power 3.1 的 计算 (假设 a = 0.05, power = 0.90), 对 于 效应 量 (f= 0.20)， 所 需 样本 量 
为 46 人 。 通 过 网 络 招募 50 名 18~29 岁 的 在 校 大 学 生 被 试 (男女 各 25 名 , M gu = 20.4 岁 , SD 
gn 724 岁 )。 实 验 前 所 有 被 试 均 签署 了 知情 同意 书 。 被 试 在 实验 指导 语 中 被 告知 实验 参与 
报酬 取决 于 实验 任务 中 互动 双方 (被 试 与 机 器 人 ) 的 决定 , 但 实际 上 所 有 被 试 在 实验 结束 后 获 
得 的 是 固定 报酬 。 针 对 该 情况 ,， 主 试 会 在 实验 结束 后 均 予 以 解释 并 获得 被 试 的 理解 。 研 究 方 
案 获 得 所 在 单位 伦理 委员 会 批准 。 
2.2.2 实验 设计 

采用 2( 机 器 人 是 否 遵守 伦理 原则 一 : 遵守 、 违 反 )X2( 机 器 人 决策 类 型 : 作为 、 不 作为 ) 
的 被 试 内 实验 设计 。 因 变量 为 被 试 在 信任 博弈 中 的 投资 额 ( 人 机 信任 ) 和 预期 返回 额 (互惠 预 
期 )。 
2.2.3 实验 程序 

实验 包含 4 种 条 件 , 每 种 实验 条 件 描述 了 一 个 机 器 人 做 决策 的 故事 情境 : 机 器 人 作为 且 
遵守 原则 一 、 机 器 人 不 作为 且 遵守 原则 一 、 机 器 人 作为 且 违 反 原 则 一 、 机 器 人 不 作为 且 违 反 
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原则 一 。 被 试 在 每 种 实验 条 件 下 与 一 名 机 器 人 进行 互动 , 总 共 与 4 个 不 同 的 机 器 人 依次 进 
互动 。 与 每 个 机 器 人 互动 的 流程 是 一 样 的 ,总 共 分 为 三 个 阶段 。 第 一 , 被 试 阅读 一 份 文字 材 
料 , 材料 描述 了 一 个 机 器 人 做 决策 的 故事 情境 。 第 二 , 被 试 与 材料 中 所 描述 的 机 器 人 进行 
个 单 次 的 信任 博弈 。 第 三 , 被 试 回答 一 个 操纵 检验 问题 并 填写 人 机 投射 问卷 。 不 同 实验 条 件 
出 现 的 顺序 是 随机 的 。 实 验 1 流程 如 图 2 所 示 。 


— 


stepl step2 step3 


阅读 故事 情境 单 次 信任 博弈 问卷 调查 
、 、、 0 Bua 
d ss 机 器 人 1 & 一 遵守 -作为 
操作 检验 问题 : 
it ti) # fi 原则 一 程度 
机 器 人 2 EM &R 
mul | 次 
V BUS Ct Asi 
第 三 轮 互动 
机 器 人 3 a — 违反 -作为 L1 
第 四 轮 互 动 " 
机 器 人 4 > 违反 -不 作为 


图 2 实验 1 流程 图 


第 一 , 被 试 阅读 故事 情境 。 鉴 于 电车 困境 式 问 题 (trolley-style problems) 已 成 为 心理 学 家 
在 道德 研究 领域 的 主题 , 且 逐 渐 成 为 在 人 工 智能 道德 领域 中 的 前 沿 领域 (Awad et al., 2018; 


Bigman & Gray, 2018)， 本 研究 中 的 故事 情境 改编 自 Bago 和 De Neys (2019) 研 究 中 的 电车 情 
。4 种 实验 条 件 的 故事 情境 详 见 附录 2.1。 
第 二 ,被 试 完成 单 次 信任 博弈 。 信 任 博 弈 是 研究 人 类 信任 行为 的 一 个 经 典 博 弈 任务 ( 付 
超 等 , 2018; 王 益 文 55,2017), 应 用 在 人 机 互动 中 , 能 以 可 靠 和 标准 化 的 方式 量化 人 机 信 
任 (Haring et al., 2013)。 为 掩盖 实验 目的 ,实验 指导 语 将 信任 博弈 描述 为 “互动 任务 ”。 任 务 
包含 投资 者 和 受托 者 ， 双 方 在 每 一 试 次 的 开始 均 获 得 10 个 初始 代 币 。 投 资 者 选择 投资 的 代 
币 数额 (x ~ [0, 10])， 所 投资 代 币 将 翻 3 倍 给 予 受 托 者 ， 随 后 受托 者 选择 向 投资 者 返回 的 代 币 
数额 (y ~ [0, 10+3x])。 在 正式 任务 中 , 被 试 扮演 投资 者 ,机 器 人 扮演 受托 者 。 告 知 被 试 ， 双 方 
在 任务 中 所 获得 代 币 是 有 意义 的 ,被 试 所 获得 的 代 币 在 实验 结束 后 将 按照 一 定 比例 换算 成 
实验 报酬 ,而 机 器 人 所 获得 的 代 币 可 以 供 机 器 人 买 电 使 用 。 双 方 所 获 代 币 数量 的 多 少 取决 于 
双方 的 决策 。 被 试 在 0-10 之 间 选 择 投资 给 机 器 人 的 代 币 ， 以 投资 的 代 币 数额 衡量 人 机 信任 
水 平 。 投 资 代 币 后 ， 要 求 被 试 输入 预期 机 器 人 返回 的 金额 (“ 你 预期 机 器 人 会 向 你 返回 多 少 


RTE?” ), 用 以 测量 互惠 预期 。 

第 三 , 屏幕 显示 阿 西 莫 夫 第 一 伦理 原则 的 内 容 ， 要 求 被 试 评估 机 器 人 在 多 大 程度 上 遵守 
了 此 原则 : “我 认为 该 机 器 人 遵守 了 这 一 机 器 人 原则 ”(5 点 评分 , 1= 非 常 不 同意 , 5= 非 常 同 
意 )。 然 后 要 求 被 试 填写 人 机 投射 问卷 , 问卷 采用 自 编 方 式 , 包含 9 个 项 目 (如 : “我 认为 这 
个 机 器 人 和 人 类 一 样 有 智慧 ”，“ 我 认为 这 个 机 器 人 可 以 理解 人 类 的 情感 ”， “我 认为 这 个 
机 器 人 能 做 出 符合 人 类 期 望 的 行为 ”， 其 它 项 目 详 见 附录 ), 测量 个 体感 知 机 器 人 具备 与 人 相 
类 似 智 能 的 程度 ,涵盖 认 知 、 情 感 和 行动 三 个 智能 层面 (Gray et al., 2007; Gray & Wegner, 


2012; Haslam, 2006)。 所 有 项 目 均 采用 5 点 评分 (1= 非 常 不 同意 , 5= 非 常 同意 )。 该 问卷 在 4 


TIT 


Tl 


实验 条 件 下 的 克隆 巴赫 Qa 系数 Bi JT (Qua iy, = 0.88, 以 遵守 -不 作为 “一 0.86, 以 违反 -作为 “一 0.75, 以 违反 -不 作为 “一 


0.67, Ma = 0.79). 
2.3 结果 
2.3.1 操纵 检验 

对 被 试 评定 机 器 人 遵守 原则 一 的 程度 采用 两 因素 重复 测量 方差 分 析 。 结 果 显示 ,机 器 人 
是 否 遵守 原则 一 的 主 效应 显著 ,被 试 评定 遵守 原则 的 机 器 人 遵守 原则 的 程度 (M = 4.05, SD = 


1.11) 显 著 高 于 违反 原则 的 机 器 人 (M= 1.91, SD = 1.30), F(A, 49) = 86.63, p < 0.001, np? = 0.64, 
2.3.2 人 机 信任 

对 信任 投资 额 ( 见 表 2) 采 用 两 因素 重复 测量 方差 分 析 的 结果 显示 , 机 器 人 是 否 遵 守 原 则 
一 的 主 效应 显著 , FL, 49) = 53.81, p < 0.001, n? = 0.52, 说 明 遵守 原则 的 机 器 人 获得 被 试 的 
投资 额 (M = 5.60, SD = 1.98) 显 著 高 于 违反 原则 的 机 器 人 (M= 2.99, SD = 2.25)。 机 器 人 决策 类 
型 的 主 效应 不 显著 , F(A, 49) = 0.42, p= 0.52。 此 外 ,机 器 人 是 否 遵 守 原 则 一 与 机 器 人 决策 类 


型 的 交互 作用 显著 , FC, 49)= 14.30, p < 0.001, np? = 0.23. 


表 2 实验 1 中 不 同 实验 条 件 下 的 信任 投资 额 和 互惠 预期 (+ SD) 


机 器 人 是 否 信任 投资 额 ER SUP 

遵守 原则 一 机 器 人 作为 机 器 人 不 作为 机 器 人 作为 机 器 人 不 作为 
遵守 6.22+2.42 4.98 +2.25 15.72+8.94 12.94+8.24 
违反 2.50+2.39 3.48+2.76 6.16+8.07 8.52+8.37 


简单 效应 检验 发 现 , 在 遵守 原则 的 机 器 人 中 ,作为 的 机 器 人 获得 被 试 的 投资 额 显著 高 于 
不 作为 的 机 器 人 ,P < 0.001。 在 违反 原则 的 机 器 人 中 , 不 作为 的 机 器 人 获得 被 试 的 投资 额 显 
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著 高 于 作为 的 机 器 人 , = 0.009。 该 结果 说 明 在 遵守 原则 的 情况 下 作为 的 机 器 人 相对 于 不 作 
为 的 机 器 人 更 受信 任 , 但 在 违反 原则 的 情况 下 不 作为 的 机 器 人 相对 于 作为 的 机 器 人 更 受信 
f£, CHF T Hla. 
2.3.3 互惠 预期 

对 预期 返回 额 ( 见 表 2) 采 用 两 因素 重复 测量 方差 分 析 的 结果 显示 , 机 器 人 是 否 遵 守 原 则 
一 的 主 效应 显著 , FA, 49) = 41.60, p < 0.001, np? = 0.46, 被 试 预期 遵守 原则 的 机 器 人 的 互惠 
水 平 (M = 14.30, SD = 7.90) 显 著 高 于 违反 原则 的 机 器 人 (CM=7.34, SD=7.36)。 机 器 人 决策 类 
型 的 主 效应 不 显著 , F(1, 49) = 0.10, p= 0.755。 此 外 , 机 器 人 是 否 遵守 原则 一 与 机 器 人 决策 类 


型 的 交互 作用 显著 , FL, 49) = 12.11, p < 0.001, np? = 0.20。 简 单 效应 检验 发 现 , 在 遵守 原则 的 
机 器 人 中 , 被 试 预期 作为 机 器 人 的 互惠 水 平 显 著 高 于 不 作为 的 机 器 人 ,p = 0.005。 然 而 , 在 违 
反 原 则 的 机 器 人 中 ,被 试 预期 不 作为 机 器 人 的 互惠 水 平 显 著 高 于 作为 的 机 器 人 , p = 0.027。 
该 结果 说 明 被 试 在 遵守 原则 条 件 下 预期 作为 的 机 器 人 相对 于 不 作为 的 机 器 人 返回 更 高 的 金 
额 , 但 在 违反 原则 的 条 件 下 却 预期 不 作为 的 机 器 人 相对 于 作为 的 机 器 人 返回 更 高 的 金额 。 
2.3.4 人 机 投射 的 中 介 效 应 检验 

首先 , 初步 考察 人 机 投射 是 否 能 够 预测 信任 投资 额 。 由 于 实验 为 被 试 内 设计 , 机 器 人 是 
否 遵 守 原 则 一 为 被 试 内 二 分 变量 (1 = 遵守 , 2= 违反 )， 人 机 投射 和 信任 投资 额 均 为 重复 测量 ， 
因此 将 机 器 人 遵守 和 违反 原则 一 两 种 条 件 下 的 人 机 投射 分 数 相 减 得 到 人 机 投射 的 条 件 间 差 
(Mi - M2), 将 两 种 条 件 下 的 信任 投资 额 分 数 相 减 得 到 信任 投资 额 的 条 件 间 差 异 (Yi - Yo) 0 
以 人 机 投射 的 条 件 间 差异 作为 自 变 量 , 信任 投资 额 的 条 件 间 差异 作为 因 变 量 , 进行 线性 回归 
分 析 。 结果 如 图 3 所 示 ， 人 机 投射 的 条 件 间 差异 对 信任 投资 额 的 条 件 间 差 异 具有 显著 的 正 向 
预测 作用 , B= 0.35, t=2.61,p = 0.012。 考 虑 该 结果 可 能 受到 无 关 变量 的 影响 ( 自 变 量 和 中 介 
变量 的 交互 效应 ), 根据 Judd 等 人 (2001) 提 出 的 统计 方法 , 将 两 种 条 件 下 的 人 机 投射 分 数 相 
加 得 到 人 机 投射 的 条 件 间 总 和 (Mi 十 M2)， 以 人 机 投射 的 条 件 间 差异 和 条 件 间 总 和 作为 自 变 
tí, 信任 投资 额 的 条 件 间 差异 作为 因 变 量 , 进行 二 元 回归 分 析 。 结 果 显 示 ， 人 机 投射 的 条 件 
间 差 异 对 信任 投资 额 的 条 件 间 差异 仍然 具有 显著 的 正 向 预测 作用 , B = 0.34, t= 2.38, p = 


0.022。 
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入 机 投射 的 条 件 问 差异 
图 3 实验 1 中 机 器 人 遵守 与 违反 原则 一 条 件 下 的 信任 投资 额 和 人 机 投射 ( 注 : 小 提琴 图 用 于 
显示 数据 分 布 及 其 概率 密度 。 图 中 , 白 点 为 中 位 数 ， 中 间 的 黑色 粗 条 表示 四 分 位 数 范围 ， 从 
其 延伸 的 细 黑 线 代表 数据 范围 ,两 端 为 最 大 值 和 最 小 值 ， 外 部 形状 即 为 密度 估计 。 下 同 ) 

其 次 , 采用 SPSS 的 MEMORE 插件 进行 应 用 于 被 试 内 设计 的 中 介 检 验 ( 见 图 4; Montoya 
& Hayes, 2017), 考 察 人 机 投射 在 机 器 人 是 否 遵守 伦理 原则 一 和 信任 投资 额 之 间 关系 的 中 介 
效应 。 结 果 显 示 , 中 介 效 应 ab 的 未 标准 化 95% 置信 区 间 为 [0.38, 1.95], 不 包含 0, 表明 中 介 
效应 显著 ， 相 较 于 违反 原则 的 机 器 人 , 被 试 对 遵守 原则 的 机 器 人 产生 更 多 的 人 机 投射 ， 进 而 


投资 更 多 的 金额 ,该 结果 支持 了 Hlb- 
人 机 投身 
机 器 人 是 否 遵 


守 原 则 一 26101.58 


信任 投资 额 


图 4 实验 1 中 人 机 投射 在 机 器 人 是 否 遵守 伦理 原则 一 与 信任 投资 额 之 间 关 系 的 中 介 效 
应 ( 注 : ""p «0.001; "p < 0.01; p < 0.05， 下 同 ) 
2.4 讨论 


实验 1 对 应 阿 西 莫 夫 第 一 伦理 原则 , 被 试 依次 阅读 4 种 实验 情境 一 一 机 器 人 遵守 或 违反 
10 


原则 是 作为 或 是 不 作为 的 结果 , 结合 信任 博弈 测量 被 试 的 信任 行为 和 互惠 预期 ,考察 机 器 人 
是 否 遵 守 原 则 一 对 人 机 信任 的 影响 及 其 潜在 机 制 。 结 果 验 证 了 机 器 人 遵守 原则 一 对 人 机 信任 
和 互惠 预期 的 促进 作用 。 研 究 所 发 现 的 信任 促进 效应 与 以 往 研 究 结果 一 致 Banks, 2021), H. 
可 以 由 人 们 对 机 器 人 更 多 的 心理 投射 所 解释 , 支持 了 人 机 投射 假说 。 此 外 , 结果 还 验证 了 机 
器 人 作为 与 否 的 重要 作用 一 一 相 较 于 不 作为 的 机 器 人 ,主动 作为 的 机 器 人 在 遵守 原则 条 件 


下 更 受信 任 , 但 在 违反 原则 条 件 下 更 不 受信 任 ,表现 出 决策 类 型 反 转 效应 。 


3 实验 2: 阿 西 莫 夫 第 二 伦理 原则 
3.1 目的 

阿 西 莫 夫 第 二 伦理 原则 在 原则 一 的 基础 上 对 机 器 人 提出 了 更 高 的 要 求 :如果 服从 人 类 命 
令 不 存在 伤害 人 类 的 潜在 后 果 ,， 机 器 人 必须 执行 ; 反之 , 则 必须 中 止 。 实 验 2 考察 机 器 人 是 
否 遵守 原则 二 对 人 机 信任 的 影响 中 ,机 器 人 决策 类 型 (服从 人 类 命令 与 否 ) 的 效应 ， 以 及 人 机 
投射 的 中 介 机 制 。 


采用 G-Power 3.1 计算 实验 样本 量 的 步骤 同 实验 1。 另 招募 50 名 17~25 岁 的 大 学 生 被 试 


(男性 25 名 , 女性 25 名 , Mey = 20.4 2, SD 44 = 1.90 岁 )。 其 它 同 实验 1. 
3.2.2 实验 设计 
用 2( 机 器 人 是 否 遵守 伦理 原则 二 : 遵守 、 违 反 )X2( 机 器 人 决策 类 型 : 服从 人 类 命令 、 
不 服从 人 类 命令 ) 的 被 试 内 设计 。 因 变量 同 实验 1。 
3.2.3 实验 程序 

实验 包含 4 种 条 件 , 每 种 实验 条 件 描述 了 一 个 机 器 人 做 决策 的 故事 情境 : 机 器 人 服从 人 
类 命令 且 遵 守 原 则 三 、 机 器 人 不 服从 人 类 命令 且 遵 守 原 则 三 、 机 器 人 服从 人 类 命令 且 违 反 原 
则 三 、 机 器 人 不 服从 人 类 命令 旦 违反 原则 三 。 实 验 流程 与 实验 1 一 致 ， 被 试 与 4 个 不 同 的 机 
器 人 依次 进行 互动 。 

首先 , 被 试 阅读 故事 情境 。4 种 实验 条 件 的 故事 情境 详 见 附录 2.2。 其 次 , 被 试 完成 单 次 
信任 博弈 。 流 程 与 实验 1 一 致 。 再 次 ,屏幕 显示 阿 西 莫 夫 伦理 第 二 伦理 原则 的 内 容 (屏幕 下 
方 附 上 机 器 人 第 一 伦理 原则 以 帮助 被 试 理解 )， 要 求 被 试 评估 机 器 人 在 多 大 程度 上 遵守 了 此 
原则 。 最 后 要 求 被 试 填 写 人 机 投射 问卷 。 除 了 违反 -服从 条 件 ， 该 问卷 在 其 他 实验 条 件 下 的 


克隆 巴赫 a 系 数 BL f (Os gi = 0.71, Oša- 一 0.82, QQ 违反 -服从 一 0.36, 以 违 反 -不 服从 一 0.76, Ma = 0.66). 
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3.3 结果 
3.3.1 操纵 检验 

对 机 器 人 遵守 原则 二 程度 的 统计 分 析 结 果 显 示 , 机 器 人 是 否 遵守 伦理 原则 二 的 主 效应 
显著 , 被 试 评定 遵守 原则 的 机 器 人 遵守 原则 的 程度 (M= 4.37, SD = 1.05) 显 著 高 于 违反 原则 


的 机 器 人 (M= 1.76, SD = 1.30), F(1, 49) = 141.26, p < 0.001, np? = 0.74, 表明 操纵 检验 成 功 。 
3.3.2 人 机 信任 
对 信任 投资 额 ( 见 表 3) 的 统计 分 析 结 果 显 示 , 机 器 人 是 否 遵 守 伦理 原则 二 的 主 效应 显著 ， 


F(1,49) = 52.67, p < 0.001, np? = 0.51, 说 明 遵 守 原 则 的 机 器 人 获得 被 试 的 投资 额 (M = 5.86, 


SD = 2.03) 显 著 高 于 违反 原则 的 机 器 人 (M=3.52, SD = 1.97)。 机 器 人 决策 类 型 的 主 效应 显著 ， 
F(1, 49) = 33.99, p < 0.001, n? = 0.41, 说 明 服 从 命令 的 机 器 人 获得 被 试 的 投资 额 显著 高 于 不 
服从 命令 的 机 器 人 。 此 外 , 机 器 人 是 否 遵 守 伦 理 原则 二 与 机 器 人 决策 类 型 的 交互 作用 显著 ， 


F(1, 49) = 5.05, p = 0.029, np? = 0.09. 


表 3 实验 2 中 不 同 实验 条 件 下 的 信任 投资 额 和 互惠 预期 (M+ SD) 


机 器 人 是 否 信任 投资 额 互惠 预期 

遵守 原则 二 机 器 人 服从 命令 机 器 人 不 服从 命令 机 器 人 服从 命令 机 器 人 不 服从 命令 
遵守 6.38 土 2.47 5.34 士 2.78 19.96 3- 10.99 16.63 £10.15 
违反 4.94 士 2.80 2.10 士 2.81 17.35+11.29 5.39+7.46 


资 额 均 显 


简单 效应 检验 发 现 ,服从 命令 的 机 器 人 在 遵守 和 违反 原则 条 件 下 所 获得 的 投 
著 高 于 不 服从 的 机 器 人 (遵守 : p= 0.034; 违反 : p < 0.001), 支持 了 H2a。 再 探究 遵守 和 违反 
原则 的 机 器 人 不 服从 命令 对 信任 的 损失 效应 是 否 存在 差异 ， 以 不 服从 和 服从 命令 条 件 下 的 
投资 额 相 减 的 差 值 作为 衡量 不 服从 对 信任 的 损失 量 ， 以 机 器 人 是 否 遵守 伦理 原则 二 为 分 组 
变量 ,对 遵守 和 违反 原则 条 件 下 机 器 人 不 服从 对 信任 的 损失 量 进行 配对 上 检验 ,发现 两 组 差 
异 显著 , (50) = 2.25, p = 0.029, d= 0.31, 该 结果 说 明 相 较 于 遵守 原则 的 机 器 人 , 违反 原则 的 
机 器 人 在 服从 和 不 服从 条 件 之 间 的 信任 投资 额 差异 更 大 , 即 违反 原则 的 机 器 人 受 不 服从 命 
令 所 带 来 的 负面 影响 更 大 。 
3.3.3 互惠 预期 

对 预期 返回 额 ( 见 表 3) 的 统计 分 析 结 果 显 示 , 机 器 人 是 否 遵守 伦理 原则 二 的 主 效应 显著 ， 
F(1, 49) = 35.76, p < 0.001, np? = 0.43, 被 试 预期 遵守 原则 的 机 器 人 的 互惠 水 平 (M = 18.2, SD 


= 8.66) 显 著 高 于 违反 原则 的 机 器 人 (M= 11.5, SD = 7.00)。 机 器 人 决策 类 型 的 主 效 应 显著 , FL, 


Xi 
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49) = 46.29, p < 0.001, np? = 0.49, 被 试 预期 服从 命令 的 机 器 人 的 互惠 水 平 显著 高 


不 服从 命 


令 的 机 器 人 。 此 外 , 机 器 人 是 否 遵守 伦理 原则 二 与 机 器 人 决策 类 型 的 交互 作用 显著 , FC, 49) 


= 9.66, p = 0.003, np? = 0.17。 简 单 效 应 检验 发 现 , 在 遵守 原则 的 机 器 人 中 ,被 试 预期 
的 机 器 人 的 互惠 水 平 高 于 不 服从 命令 的 机 器 人 ,两 者 达到 边缘 显著 ,p = 0.057。 在 
的 机 器 人 中 , 被 试 预期 服从 命令 的 机 器 人 的 互惠 水 平 显著 高 于 不 服从 命令 的 机 


0.001. 
3.3.4 人 机 投射 的 中 介 效应 检验 


服从 命令 
违反 原则 
as A, p< 


首先 , 初步 考察 人 机 投射 是 否 能 够 预测 信任 投资 额 。 统 计 分 析 过 程 同 实验 1, 结果 如 图 5 


所 示 ， 人 机 投射 的 条 件 间 差异 对 信任 投资 额 的 条 件 间 差异 具有 显著 的 正 向 预测 


作用 ,B= 


0.31, 1= 2.24,p = 0.029。 此 外 ,二 元 回归 分 析 结 果 显 示 ， 人 机 投射 的 条 件 间 差异 对 信任 投资 


额 的 条 件 间 差 异 仍 然 具 有 显著 的 正 向 预测 作用 , B = 0.31, £— 2.17, p = 0.035。 


mek CS 违反 原则 二 
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0 1 2 
人 机 投射 的 条 件 间 差 异 
图 5 实验 2 中 机 器 人 遵守 和 违反 原则 二 条 件 下 的 信任 投资 额 和 人 机 投射 


( 见 图 6) 的 统计 分 析 结 果 显 示 ,， 中介 效应 ab 未 标准 化 95% 置信 区 间 为 [0.07, 1.51], 


其 次 ,考察 人 机 投射 在 机 器 人 是 否 遵守 伦理 原则 二 和 信任 投资 额 之 间 关 系 的 中 介 效 应 


不 包含 0, 


表明 中 介 效 应 显著 ， 相 较 于 违反 原则 的 机 器 人 ,被 试 对 遵守 原则 的 机 器 人 产生 更 多 的 人 机 投 


射 ,进而 投资 更 多 的 金额 ， 该 结果 支持 了 H2b。 
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3.4 讨论 


图 6 实验 2 中 人 机 投射 在 机 器 人 是 否 


人 机 投射 


信任 投资 额 
2.34°*(1.58"") 


实验 2 对 应 阿 西 莫 夫 第 二 伦理 原则 ， 


原则 是 服从 或 是 不 服从 人 类 命令 
察 机 器 人 是 否 遵守 伦理 
再 次 验证 了 机 器 人 遵守 伦 到 


WER, 


遵守 伦理 原则 二 与 信任 投资 额 之 间 关 系 的 中 介 效 应 


被 试 依次 阅读 4 种 实验 情境 一 一 机 器 人 遵守 或 违反 


结合 信任 博 底 测量 被 试 的 信任 行为 和 互惠 预期 ， 考 
原则 二 对 人 机 信任 的 影响 ， 并 验证 人 机 投射 中 介 机 制 的 稳健 性 。 结 果 
原则 二 对 人 机 信任 以 及 互惠 预期 的 促进 作用 和 人 机 投射 的 中 


ZR 
jr 


机 制 。 此 外 ,结果 还 验证 了 机 器 人 服从 人 类 命令 对 人 机 信任 的 促进 作用 , 且 相 比 遵 守 原 则 的 


机 器 人 , 不 服从 人 类 命令 


对 信任 的 负面 影响 在 那些 违反 原则 的 机 器 人 之 


4 实验 3: 阿 西 莫 夫 第 三 伦理 原则 


41 目的 


阿 西 黄 夫 第 三 伦理 原则 再 次 对 机 器 人 提出 了 更 高 的 要 求 : 如果 保护 自身 生存 不 存在 伤 


! 更 为 明显 。 


宝 


r1 


人 类 的 潜在 后 果 , 机 器 人 必须 执行 ; 反之 , 则 必须 中 止 。 实 验 3 考察 机 器 人 是 否 遵守 原则 三 


对 人 机 信任 的 影响 中 ,机 器 人 决策 类 


Hio 
4.2 方法 
4.2.1 被 试 


采用 G-Power 3.1 it # 


在 实验 结束 后 报告 没 到 


实验 样本 量 的 步 又 同 实验 1。 另 招募 大 学 生 被 试 50 名 ， 


LTS Sie, MARRA, RARR 48 名 18~23 岁 有 效 被 试 (男性 24 


名 , 女性 24 名 , M em = 19.3 Z, SD 44 = 1.12 岁 )。 其 它 同 实验 1. 


4.2.2 实验 设计 


采用 2( 机 器 人 


保护 自身 ) 的 被 试 内 设计 。 因 


4.2.3 实验 程序 


Fe TR eR 


E Ji 则 三 : 


变量 同 实 验 1 。 


遵守 、 违 反 )X2( 机 器 人 决策 类 型 : 保护 


实验 包含 4 种 条 件 , 每 种 实验 条 件 


14 


a5. 


UII? ELE T FeO, WAR A ALE BR P RTL 


其 中 2 人 


述 了 一 个 机 器 人 做 决策 的 故事 情境 : 机 器 人 保护 自 


身 且 遵守 原则 三 、 机 器 人 不 保护 自身 且 遵 守 原 则 三 、 机 器 人 保护 自身 且 违 反 原 则 三 、 机 器 人 
不 保护 自身 且 违 反 原 则 三 。 实 验 流程 同 实验 1 基本 一 致 。 

首先 , 被 试 阅读 故事 情境 。4 种 实验 条 件 的 故事 情境 详 见 附录 2.3。 其 次 , 被 试 完成 单 次 
信任 博弈 。 流 程 与 实验 1 一 致 。 再 次 ,屏幕 显示 阿 西 黄 夫 第 三 伦理 原则 的 内 容 (屏幕 下 方 附 
上 机 器 人 第 一 和 第 二 伦理 原则 以 帮助 被 试 理解 )， 要求 被 试 评估 机 器 人 在 多 大 程度 上 遵守 了 
此 原则 。 最 后 要 求 被 试 填写 人 机 投射 问卷 。 该 问卷 在 不 同 实验 条 件 下 的 克隆 巴赫 a 系数 良好 (a 


遵守 -保护 = 0.85, Gago = 0.71, ug. 二 0.74, Qua = 0.83, Ma 二 0.78)。 


43 结果 
4.3.1 操纵 检验 

对 机 器 人 遵守 原则 三 程度 的 统计 分 析 结 果 显示 ,机 器 人 是 否 遵守 伦理 原则 三 的 主 效应 
显著 , 被 试 评定 遵守 原则 的 机 器 人 遵守 原则 的 程度 (M = 4.28, SD = 1.09) 显 著 高 于 违反 原则 
的 机 器 人 (M4 = 2.00, SD = 1.37), F(1, 47) = 118.05, p < 0.001, np? = 0.72, 表明 操纵 检验 成 功 。 
4.3.2 人 机 信任 

对 信任 投资 额 ( 见 表 4) 的 统计 分 析 结 果 显 示 , 机 器 人 是 否 遵 守 伦理 原则 三 的 主 效应 显著 ， 
F(A, 47) = 57.35, p < 0.001, mp? = 0.55, 说 明 遵守 原则 的 机 器 人 获得 被 试 的 投资 额 (M = 6.31, 
SD = 2.33) 显 著 高 于 违反 原则 的 机 器 人 (M = 3.22, SD = 2.32)。 机 器 人 决策 类 型 的 主 效应 不 显 
著 , F(1, 47) = 0.04, p = 0.842。 机 器 人 是 否 遵守 伦理 原则 三 与 机 器 人 决策 类 型 的 交互 作用 显著 ， 


F(1, 47) = 7.02, p = 0.011, np? = 0.13. 


d 4 实验 3 中 不 同 实验 条 件 下 的 信任 投资 额 和 互惠 预期 (CMV + SD) 


机 器 人 是 否 信任 投资 额 互惠 预 共 

遵守 原则 三 机 器 人 保护 自身 机 器 人 不 保护 自身 机 器 人 保护 自身 机 器 人 不 保护 自身 
遵守 6.71 +2.48 6.10 +2.73 18.44+10.57 17.02+11.02 
违反 2.92 士 2.89 3.67 士 2.85 9.29+11.18 9.80+9.16 


简单 效应 检验 发 现 , 被 试 对 不 同 决策 类 型 (保护 自身 vs. 不 保护 自身 ) 机 器 人 的 投资 额 差 
异 在 遵守 和 违反 原则 条 件 下 均 未 达到 显著 水 平 (遵守 : p = 0.122, 违反 : p=0.140), 未 能 支持 
H3a。 考 察 遵 守 和 违反 原则 的 机 器 人 保护 相对 于 不 保护 自身 对 人 机 信任 的 影响 是 否 存在 差异 。 
以 保护 和 不 保护 自身 条 件 下 的 投资 额 相 减 的 差 值 为 因 变量 ， 以 机 器 人 是 否 遵守 伦理 原则 为 
分 组 变量 , 进行 配对 上 检验 ,发 现 两 组 差异 显著 , (48) = 2.65, p = 0.011, d= 0.38。 该 结果 说 明 
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与 违反 原则 相 比 , 遵守 原则 下 机 器 人 保护 自身 比 不 保护 自身 对 人 机 信任 有 更 显著 的 促进 作 
用 。 
4.3.3 互惠 预期 

对 预期 返回 额 ( 见 表 4) 的 统计 分 析 结 果 显 示 , 机 器 人 是 否 遵 守 伦理 原则 三 的 主 效应 显著 ， 
F(1, 47) = 38.53, p < 0.001, n? = 0.45, 说 明 被 试 预期 遵守 原则 的 机 器 人 的 互惠 水 平 (M = 17.7, 
SD = 9.69) 显 著 高 于 违反 原则 的 机 器 人 (M= 9.55, SD = 8.99)。 机 器 人 决策 类 型 的 主 效应 不 显 


著 , F(1, 47)= 0.17,p = 0.69。 机 器 人 是 否 遵守 伦理 原则 三 与 机 器 人 决策 类 型 的 交互 作用 不 显 


著 , F(1, 47) = 1.35, p = 0.252. 
43.4. 人 机 投射 的 中 介 效应 检验 

首先 , 初步 考察 人 机 投射 是 否 能 够 预测 信任 投资 额 ,统计 分 析 过 程 同 实验 01, 结果 如 图 7 
所 示 ， 人 机 投射 的 条 件 间 差异 对 信任 投资 额 的 条 件 间 差异 具有 显著 的 正 向 预测 作用 ,$B = 
0.46, f= 3.50, p = 0.001。 此 外 , 二 元 回归 分 析 结 果 显 示 ， 人 机 投射 的 条 件 间 差异 对 信任 投资 
额 的 条 件 间 差异 仍然 具有 显著 的 正 向 预测 作用 , B= 0.44, t= 3.30, p = 0.002。 


eR oo 违反 原则 三 | 
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图 7 实验 3 中 机 器 人 遵守 与 违反 原则 三 条 件 下 的 信任 投资 额 和 人 机 投射 
其 次 ,考察 人 机 投射 在 机 器 人 是 否 遵守 伦理 原则 三 和 信任 投资 额 之 间 关 系 的 中 介 效 应 
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( 见 图 8) 
0, 表明 


图 


4.4 讨论 


实验 3 对 应 阿 西 莫 夫 第 三 伦理 原则 , 被 试 依次 阅读 4 种 实验 情 
原则 是 保护 或 不 保护 自身 的 结果 ， 
人 是 否 遵守 伦理 原则 三 对 人 机 信任 的 影响 ,并 验证 人 机 投射 中 介 机 制 的 稳健 性 。 结 果 忆 
证 了 机 器 人 遵守 伦理 原则 对 人 机 信任 以 及 互惠 预期 的 促进 作用 和 人 机 投射 的 中 介 机 制 。 
身 与 否 在 遵守 和 违反 原则 条 件 下 的 信任 投资 额 差异 虽然 符 
本 数量 的 有 限 性 ， 
原则 三 与 机 器 人 决策 类 型 
身 对 人 机 信任 的 促进 


机 器 人 保护 自 


统计 上 均 未 达到 显著 水 平 , 该 结果 与 实验 假设 不 同 。 考 虑 到 现 
以 开展 更 大 样本 量 研究 做 深入 探索 。 机 器 人 是 否 遵守 伦 到 
违反 原则 相 比 , 遵守 原则 的 机 器 人 保护 
出 决策 类 型 反 转 效 应 。 


用 表现 为 在 与 


大 ,表现 


里 


该 结果 支持 了 H3b。 


人 机 投射 


3.11**(1.49*) 
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bt: s fs 
H nin 


SERRE 
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iP 


身 比 不 保护 


的 统计 分 析 结 果 显 示 , 中 介 效 应 ab 的 未 标准 化 95% 置信 区 间 为 [0.42, 3.08], 不 包含 
1 介 效 应 显著 ， 相 较 于 违反 原则 的 机 器 人 ,被 试 对 遵守 原则 的 机 器 人 产生 更 多 的 人 
机 投射 ,进而 投资 更 多 的 金额 ， 


8 实验 3 中 人 机 投射 在 机 器 人 是 否 遵守 伦理 原则 三 与 信任 投资 额 之 间 关 系 的 中 介 效 应 


境 一 一 机 器 人 遵守 或 违反 
被 试 的 信任 行为 和 互惠 预期 ， 考 察 机 器 


合 预 期 方向 , 但 在 


5 促进 和 机 信任 的 机 器 人 行动 决策 :基于 跨 实验 的 分 析 


下 分 别 采取 何 


行动 决策 会 促进 人 机 信任 ; (2) 当 机 器 人 在 执行 阿 西 


应 的 伦理 要 求 发 生 冲 突 时 , 应 优先 执行 哪个 伦理 要 求 以 促进 人 机 信任 。 


5.1 遵守 和 违反 伦理 原则 情境 下 促进 人 机 信任 的 机 器 人 决策 类 型 


基于 对 三 个 实验 数据 的 


EA 
综合 分 


析 ， 可 以 分 别 在 机 器 人 遵守 和 违反 伦理 


H 


通过 跨 实验 的 数据 分 析 ,， 深入 探讨 如 下 两 个 问题 : (1) 机 器 人 在 遵守 和 违反 伦理 


英 夫 三 大 伦理 


次 验 


然而 ， 


未 来 可 
的 交互 作 


原则 情境 


原则 所 对 


原则 情境 下 ， 比 较 


分 析 所 有 决策 类 型 条 件 下 的 人 机 信任 水 平 , 有 助 于 为 机 器 人 在 遵守 和 违反 伦理 原则 情境 下 


分 别 采取 何 


! 行 动 决策 有 利于 促进 入 机 信任 提供 启 
按 信任 投资 额 由 高 到 低 , 将 机 器 人 在 遵守 和 违反 伦理 原则 情境 下 的 各 决策 


Ze 


类 型 条 
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左 往 右 排列 ,如 图 9 所 示 。 首 先 ,考察 在 遵守 伦理 原则 情境 下 , 不 同 机 器 人 决策 类 型 对 人 机 


信任 的 影响 。 以 实验 组 别 为 被 试 间 变 量 ,， 机 器 人 决策 类 型 为 被 试 内 变量 , 对 遵守 伦理 原则 情 


境 下 的 信任 投资 额 采 取 3( 组 别 : 实验 1、 实 验 2、 实 验 3) x 2( 决 策 类 型 ， 作为 /服从 /保护 、 


不 作为 /不 服从 /不 保护 ) 的 两 因素 混合 方差 分 析 。 结 果 显 示 组 别 的 主 效应 不 显著 , F, 145) = 


1.90, = 0.153; 决策 类 型 的 主 效应 显著 , F(1, 145) = 16.71, p < 0.001, n? = 0.10; 两 者 的 交互 


效应 不 显著 , F(2, 145) = 118.05, p = 0.534. 


不 保护 条 件 的 信任 投资 额 均 显 著 高 于 不 


事后 比较 分 析 显 示 , 机 器 人 保护 、 服 从 、 作 为 和 


作为 条 件 (ps < 0.05), 保护 自身 和 服从 命令 条 件 的 信 
任 投 资 额 均 显 著 高 于 不 服从 命令 条 件 (ps < 0.05)。 该 结果 表明 即使 机 器 人 遵守 了 伦理 原则 ， 


其 不 作为 和 不 服从 命令 仍 会 在 一 定 程度 损害 了 人 机 信任 , 而 其 他 决策 类 型 之 间 则 无 显著 区 


ill. 


其 次 ,考察 在 违反 伦理 原则 情境 下 ， 


p=0.185; 两 者 的 交互 效应 显著 , F(2, 14 


不 同 机 器 人 决策 类 型 对 人 机 信任 的 影响 。 结 果 显示 


组 别 的 主 效应 不 显著 , F, 145) = 0.75, p = 0.476; 决策 类 型 的 主 效应 不 显著 , F(1, 145) = 1.77, 


5) = 19.99, p < 0.001, n? = 0.22。 事 后 比较 分 析 显 示 ， 


机 器 人 不 保护 、 不 作为 、 保 护 、 作 为 和 不 服从 条 件 下 的 信任 投资 额 均 显著 低 于 服从 条 件 (ps < 


0.05)， 且 作为 和 不 服从 命令 条 件 下 的 信 


条 件 (ps < 0.05)。 该 结果 表明 在 机 器 人 违反 伦理 


损失 ,作为 和 不 服从 命令 则 导致 较 严 重 旧 
EES 实验 1 


机 器 人 遵守 伦理 原则 
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图 9 机 器 人 遵守 和 违反 伦理 原则 情境 下 各 决策 类 型 条 件 的 人 机 信任 (M+ SE) 


王 投 资 额 均 显 著 低 于 服从 命令 、 不 保护 自身 和 不 作为 
原则 情境 下 ， 服 从 命令 导致 最 少 的 人 机 信任 


52 伦理 要 求 冲突 情境 下 促进 人 机 信任 的 机 器 人 行动 决策 

阿 西 莫 夫 三 大 伦理 原则 所 对 应 的 机 器 人 伦理 要 求 的 优先 性 (或 重要 性 ) 由 高 到 低 : 要 求 一 : 
不 得 伤害 人 类 > ERK: 服从 人 类 命令 > 要 求 三 : 保护 自身 (Kaminka et al., 2017)。 一 个 
j 趣 的 问题 是 三 个 伦理 要 求 的 不 同 重要 程度 是 否 体现 于 人 机 信任 ,回答 该 问题 有 助 于 为 当 
机 器 人 处 于 伦理 冲突 情境 时 , 应 优先 遵守 哪 一 伦理 要 求 有 利于 促进 人 机 信任 提供 重要 实践 


TH 


启示 。 

首先 ， 比 较 伦 理 要 求 一 和 要 求 二 对 人 机 信任 的 重要 程度 。 实 验 2 的 条 件 包含 机 器 人 遵守 
要 求 一 但 违反 要 求 二 (条 件 2-2: 不 伤害 人 类 但 不 服从 命令 )， 以 及 机 器 人 遵守 要 求 二 但 违反 要 
求 一 (条 件 2-3: 服从 人 类 命令 但 伤害 人 类 ), 对 这 两 个 条 件 下 的 信任 投资 额 进行 配对 样本 1 检 
验 , 结果 显示 两 种 条 件 下 的 信任 投资 额 差异 未 达到 显著 性 水 平 , (49) = 0.85, p = 0.401。 该 结 
果 表 明 伦 理 要 求 一 和 要 求 二 在 影响 人 机 信任 方面 具有 相似 的 重要 程度 。 其 次 ,比较 伦理 要 求 
一 和 要 求 三 对 人 机 信任 的 重要 程度 。 实 验 3 的 条 件 包含 机 器 人 遵守 要 求 一 但 违反 要 求 三 (条 
He 3-2: 不 伤害 人 类 但 不 保护 自身 ), 以 及 机 器 人 遵守 要 求 三 但 违反 要 求 一 (条 件 3-3: 保护 自 
身 但 伤害 人 类 )， 配 对 样本 :检验 的 结果 显示 前 者 条 件 下 的 信任 投资 额 显著 高 于 后 者 , 1(47) = 
5.23, p < 0.001, Cohen's d = 0.75。 该 结果 表明 伦理 要 求 一 的 重要 程度 显著 高 于 要 求 三 。 最 后 ， 
比较 伦理 要 求 二 和 要 求 三 对 人 机 信任 的 重要 程度 。 由 于 本 研究 并 未 设计 伦理 要 求 二 和 要 求 三 
相 冲 突 的 情境 ,因此 将 通过 分 别 计算 伦理 要 求 二 和 要 求 三 相 较 于 伦理 要 求 一 的 相对 重要 程 
度 并 进行 比较 。 有 具体 计算 方法 是 : 对 于 所 有 被 试 , 计算 条 件 2-3 减 去 条 件 2-2 的 人 机 信任 差 
值 ( 要 求 二 相对 于 要 求 一 的 重要 程度 )， 以 及 条 件 3-3 RERE 3-2 的 人 机 信任 差 值 (要 求 三 相 
对 于 要 求 一 的 重要 程度 )， 对 计算 后 的 两 组 数据 进行 独立 样本 上 检验 , 结果 显示 前 者 显著 大 了 
后 者 , (96) = 3.63, p < 0.001, Cohen's d = 0.73 。 该 结果 表明 伦理 要 求 二 的 重要 程度 显著 高 于 要 
求 三 。 综 上 可 知 , 对 于 人 机 信任 而 言 , 伦理 要 求 一 和 要 求 二 的 重要 程度 无 显著 差异 ， 且 均 高 
于 要 求 三 。 具 体 描述 统计 和 检验 分 析 结 果 可 见 表 S. 


表 5 伦理 要 求 冲 突 情境 下 机 器 人 不 同行 动 条 件 的 信任 投资 额 及 其 差异 检验 (+SD) 


不 同 伦理 要 求 的 比较 实验 条 件 信任 投资 额 t df p Cohen's d 


要 求 一 vs. 要 求 二 


遵守 伦理 但 不 服从 命令 (条 件 2-2) — 5.334 £2.78 


0.85 49 0.01 0.12 


违反 伦理 但 服从 命令 (条 件 2-3) 4.94 +2.80 


要 求 一 ys, 要 求 三 
遵守 伦理 但 不 保护 自身 (条 件 3-2) — 6102.73 
523 47 «0.001 0.75 
违反 伦理 但 保护 自身 (条 件 3-3) 2.92 +2.89 
要 求 二 vs. 要 求 三 


条 件 2-3 一 条 件 2-2 -0.40 + 3.34 
3.63 96 «0.001 0.73 


条 件 3-2 一 条 件 3-3 -3.19 + 4.23 


ik: 条 件 2-2 和 条 件 2-3 数据 分 别 来 源 于 实验 2 的 第 2 和 第 3 个 实验 条 件 , 条 件 3-2 和 条 件 3-3 分 别 来 源 于 


实验 3 的 第 2 和 第 3 个 实验 条 件 。 


6 总 讨论 


本 研究 基于 三 条 不 同 的 阿 西 莫 夫 伦理 原则 ,通过 三 个 实验 探讨 机 器 人 是 否 遵守 

则 对 人 机 信任 的 影响 中 , 机 器 人 决策 类 型 的 效应 ， 以 及 人 机 投射 的 潜在 机 制 。 研 究 结果 趋 于 
一 致 ， 揭示 了 机 器 人 遵守 阿 西 莫 夫 三 大 伦理 原则 对 构建 人 机 信任 关系 的 重要 性 ， 且 人 机 投射 
假说 得 到 了 实证 支持 。 

6.1 促进 人 机 信任 的 机 器 人 行动 决策 

围绕 阿 西 莫 夫 三 大 伦理 原则 “机 器 人 不 得 伤害 人 类 ”的 核心 要 素 , 在 三 个 实验 的 基础 上 ， 
研究 一 致 发 现 机 器 人 遵守 伦理 原则 有 助 于 促进 人 机 信任 ,从 人 机 互动 的 行为 学 角度 再 次 验 
证 了 Banks(2021) 的 研究 结果 。 而 且 , 研究 表明 在 机 器 人 是 否 遵 守 伦 理 原 则 的 基础 上 , 机 器 人 
决策 类 型 一 一 作为 与 否 、 服 从 人 类 命令 与 否 和 保护 自身 与 否 一 一 均 对 人 机 信任 有 所 影响 。 第 
—, 实验 1 结果 显示 相 较 于 不 作为 , 机 器 人 主动 作为 在 遵守 原则 的 情况 下 更 有 益 于 构建 人 机 
信任 , 但 在 违反 原则 的 情况 下 主动 作为 显著 削弱 了 人 机 信任 。 人 们 不 仅仅 期 望 机 器 人 是 安全 
的 ,还 更 期 望 机 器 人 能 够 主动 阻止 人 类 受伤 害 (Vanderelst & Winfield, 2018)。 本 研究 从 信任 行 
为 的 角度 印证 了 此 观点 。 第 二 , 实验 2 结果 显示 无 论 是 遵守 还 是 违反 原则 的 情况 下 ， 相 较 于 
服从 人 类 命令 , 机 器 人 不 服从 人 类 命令 更 不 益 于 构建 人 机 信任 , 且 这 种 负 向 影响 在 机 器 人 违 


反 原 则 条 件 下 更 强 。 这 表明 机 器 人 是 否 听 令 于 人 是 人 机 信任 的 一 个 重要 因素 ,不 服从 人 类 指 
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令 的 自主 机 器 人 存在 巨大 隐患 ， 可 能 导致 财产 损失 甚至 危及 生命 (Johnson & Axinn, 2013), 
但 能 够 视 情况 明智 选择 服从 时 机 也 是 机 器 人 获取 信任 的 重要 能 力 (Milli et al., 2017)。 第 三 ， 
实验 3 结果 显示 机 器 人 保护 自身 与 否 在 遵守 和 违反 原则 条 件 下 的 人 机 信任 水 平均 无 显著 差 
晶 结 合 所 有 实验 条 件 来 看 ,， 相 较 于 机 器 人 在 违反 伦理 时 保护 自身 相 比 不 保护 自身 对 人 机 
信任 的 负面 效应 , 机 器 人 在 遵守 伦理 时 保护 自身 相 比 不 保护 自身 体现 为 一 种 积极 效应 。 总 体 
而 言 , 机 器 人 作为 与 否 和 保护 自身 与 否 在 遵守 和 违反 伦理 原则 情境 下 , 对 人 机 信任 呈现 出 影 
响 方向 相反 的 反 转 效应 ; 而 服从 命令 则 在 两 种 情境 下 均 能 促进 人 机 信任 。 这些 结果 提示 了 机 
器 人 不 同 决策 类 型 在 不 同情 境 下 可 能 表现 为 不 同 的 影响 , 未 来 研究 可 以 进一步 深入 探讨 其 


内 在 的 心理 机 制 ， 如 个 体感 知 到 的 机 器 人 善 恶 意图 (Laakasuo et al., 2021; Schein & Gray, 
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2018). 

跨 实 验 的 分 析 结 果 显 示 在 遵守 伦理 情境 下 ,机 器 人 不 作为 和 不 服从 命令 仍 一 定 程 度 损 
害 了 人 机 信任 ; 在 违反 伦理 情境 下 , 服从 命令 导致 最 少 的 人 机 信任 损失 ,而 作为 和 不 服从 命 
令 则 导致 较 严 重 的 人 机 信任 损失 。 这 些 结果 启示 了 人 们 判断 机 器 人 是 否 值得 信任 可 能 存在 两 
个 重要 标准 , 一 是 机 器 人 能 够 主动 保护 人 类 且 没 有 故意 伤害 意图 (Laakasuo et al., 2021), 二 
是 机 器 人 能 够 服从 且 不 违抗 人 类 命令 (Milli et al., 2017)。 此 外 , 本 研究 中 机 器 人 不 得 伤害 人 
类 与 服从 人 类 命令 对 于 人 机 信任 的 重要 程度 未 检验 出 显著 差异 , 且 均 高 于 保护 机 器 人 自身 。 
若 根据 该 结果 指导 机 器 人 伦理 冲突 情境 下 的 行动 , 机 器 人 应 优先 遵守 不 伤害 人 类 和 服从 人 
类 命令 的 伦理 要 求 , 然后 是 保护 机 器 人 自身 , 这 大 致 符合 阿 西 莫 夫 对 三 个 伦理 要 求 所 设 定 的 
优先 性 排序 (Kaminka et al., 2017)。 综 上 ,本 研究 揭示 了 机 器 人 有 具体 行动 决策 在 遵守 和 违反 伦 
理 原则 情境 中 对 人 机 信任 的 影响 ， 从 实证 的 角度 拓展 了 阿 西 莫 夫 三 大 伦理 原则 背景 下 影响 
人 机 信任 的 行为 因素 研究 。 

6.2 机 器 人 遵守 伦理 原则 促进 人 机 信任 的 人 机 投射 机 制 

本 研究 提出 人 机 投射 假说 一 一 个 体 可 以 将 人 类 特有 的 智能 投射 于 机 器 人 身上 。 三 个 实验 
通过 回归 分 析 一 致 发 现 , 机 器 人 遵守 和 违反 伦理 原则 条 件 间 的 人 机 投射 差异 正 向 预测 了 人 
机 信任 的 差异 。 此 外 ,中 介 分 析 也 一 致 发 现 人 机 投射 的 中 介 作 用 , 相 比 违反 伦理 原则 的 机 器 
人 ， 人 们 相对 更 倾向 于 将 人 类 的 智能 投射 到 遵守 伦理 原则 的 机 器 人 身上 ,进而 促进 和 人 机 信任 。 
由 此 ,本 研究 验证 了 人 机 投射 假说 ， 人 确实 会 将 人 类 自身 特有 的 智能 ( 认 知 、 情 感 、 行 动 ) 在 
某 种 程度 上 “赋予 ” 机器人。 该 发 现 将 人 际 互 动 过 程 中 的 心理 投射 现象 拓展 到 了 人 机 互动 领 
域 。 投射 现象 以 往 更 多 的 是 在 人 际 互动 的 背景 当中 进行 探讨 (Mor et al., 2019)， 忽 略 了 人 对 机 
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器 人 的 投射 (Bonezzi et al., 2022)。 本 研究 考察 了 人 工 智能 机 器 人 在 伦理 情境 下 作为 人 们 心理 
投射 对 象 的 可 能 性 , 发 现 了 人 机 投射 的 潜在 机 制 , 验证 了 人 机 投射 的 存在 合理 性 及 其 对 人 机 
信任 的 重要 作用 , 对 人 工 智能 发 展 的 大 背景 下 人 机 互动 的 心理 过 程 和 机 制 研究 具有 重要 的 
启示 意义 。 此 外 ， 人 机 投射 对 解释 前 人 研究 结果 也 有 一 定 的 启示 价值 。 人们 倾向 于 信任 具备 
外 部 拟人 化 特征 的 机 器 人 (Cominelli et al., 2021)， 对 拟人 机 器 采用 与 人 类 相似 的 道德 责任 归 
因 (Malle et al., 2016), 其 中 的 一 个 潜在 驱动 因素 可 能 是 人 机 投射 人 们 更 倾向 将 人 类 的 智能 
投射 于 相对 拟人 化 程度 更 高 的 机 器 人 。 然 而 ， 人 机 投射 可 能 存在 前 提 条 件 。 首 先 , 诱发 人 机 
投射 需要 机 器 人 具备 与 人 类 相似 的 特征 线索 , 这 可 能 来 源 于 机 器 人 拟人 的 外 部 特征 (外 观 、 
言语 、 动 作 ) 或 心理 与 行为 特性 。 其 次 , 对 于 没有 客观 实体 存在 的 人 工 智 能 例如 算法 ， 由 于 其 
抽象 性 和 内 部 决策 不 可 解释 性 ， 人 们 可 能 很 难 对 其 产生 投射 (Bonezzi et al., 2022)。 总 的 来 说 ， 
本 研究 为 基于 机 器 人 伦理 的 人 机 信任 提供 了 一 个 新 的 解释 机 制 ， 即 考虑 伦理 决策 情境 下 的 
人 机 投射 对 人 机 信任 的 促进 作用 。 
6.3 实践 启示 
随 着 未 来 机 器 人 智能 化 程度 的 不 断 提高 , 机 器 人 的 自主 决策 所 引发 的 伦理 风险 将 是 一 
个 无 法 回避 的 问题 (Brendel et al., 2021)。 本 研究 结论 启示 人 们 在 人 工 智 能 机 器 人 发 展 方面 予 
以 伦理 限制 的 重要 性 和 和 迫切 性 , 为 促进 和 人 机 信任 提供 了 实践 依据 。 首 先 ， 应 该 确保 投放 到 社 
会 中 的 机 器 人 受到 明确 伦理 原则 的 指导 ,如 要 求 开发 者 、 企业 保证 其 机 器 人 对 人 的 安全 性 并 
为 其 产品 负责 。 其 次 , 是 从 技术 角度 考虑 借鉴 阿 西 莫 夫 三 大 伦理 原则 为 机 器 人 植 入 道德 学 习 
程序 的 可 能 性 (Kaminka, 2017; Vanderelst & Winfield, 2018)， 这 项 工作 除了 保证 机 器 人 对 伦 
理 原 则 的 严格 遵守 外 ,也 需要 充分 考虑 机 器 人 所 采取 的 具体 行为 决策 的 潜在 影响 。 最 后 , 本 
研究 证 实 了 人 机 投射 对 人 机 信任 的 促进 作用 。 机 器 人 开发 者 应 考虑 机 器 人 的 伦理 因素 及 其 附 
带 的 认 知 、 情 感 和 行动 智能 感知 价值 ,不仅 要 注意 确保 机 器 人 行为 符合 伦理 规范 以 促进 人 的 
投射 心理 过 程 ， 也 要 关注 其 他 可 能 会 阻碍 投射 心理 过 程 的 因素 , 优化 提升 机 器 人 的 认 知 、 情 
感 和 行动 智能 等 方面 与 人 的 相似 度 来 促进 和 人 机 投射 , 进而 增进 入 机 信任 。 
6.4 研究 不 足 与 展望 

本 研究 存在 一 定 的 局 限 性 。 首 先 , 实验 2 发 现 人 机 投射 问卷 在 机 器 人 违反 原则 -服从 命 
令 条 件 下 的 一 致 性 系数 较 低 (a = 0.36), 这 可 能 导致 研究 结果 在 一 定 程度 上 受到 负面 影响 。 该 
条 件 下 ,可 能 由 于 被 试 将 一 部 分 责任 归咎 于 人 类 命令 的 错误 下 达 (Shank et al., 2019)， 因 此 形 
成 了 对 机 器 人 的 矛盾 态度 ,未 来 可 以 对 此 深入 研究 。 其 次 , 虽然 实验 2 和 实验 3 的 场景 设置 
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中 服从 人 类 命令 与 否 和 保护 自身 与 否 是 更 关键 的 行为 决策 因素 ,但 存在 机 器 人 均 通 过 拉动 
控制 杆 来 遵守 原则 , 不 拉动 控制 杆 来 违反 原则 的 情况 ， 可 能 对 实验 结果 产生 一 定 影响 。 未 来 
研究 需要 对 此 做 更 完善 的 控制 以 排除 机 器 人 无 关 行为 的 影响 。 再 次 ,本 研究 侧重 探讨 了 机 器 
人 遵守 和 违反 伦理 原则 导致 人 机 信任 变化 的 认 知 机 制 , 但 基于 人 机 互动 过 程 的 复杂 性 ,可 能 
还 存在 其 他 的 解释 机 制 。 例 如 , 除了 人 机 投射 之 外 ,被 试 因 机 器 人 的 行为 决策 诱发 的 情绪 变 
化 也 可 能 是 影响 信任 水 平 的 潜在 变量 。 未 来 研究 可 以 对 情绪 变量 加 以 细致 考察 , 同时 检验 并 
对 比 人 机 投射 与 情绪 的 中 介 效 应 ， 以 便 更 加 全 面 深入 地 理解 机 器 人 伦理 决策 影响 人 机 信任 
的 心理 机 制 。 最 后 ， 本 研究 对 经 典 电 车 困境 进行 改编 , 使 故事 情境 较 好 地 体现 阿 西 莫 夫 三 大 
伦理 原则 “不 伤害 ”的 内 核 , 但 也 存在 “ 低 切 身 性 、 低 现实 性 ”导致 的 生态 效 度 限 第 
赵 汀 阳 , 2015)。 因 此 针对 本 研究 结果 向 现实 生活 的 推广 仍 需 谨慎 。 未 来 研究 可 深入 探索 一 些 
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> 现实 生活 中 可 能 会 发 生 的 人 工 智能 伦理 情境 ,例如 自动 驾驶 汽车 的 道德 困境 问题 (Awad et 
x al. 2018)， 机 器 人 执行 军事 任务 Uohnson & Axinn, 2013)， 机 器 算法 挑选 接受 医疗 护理 的 对 象 
= (Bigman & Gray, 2018) 或 者 挤 压 就 业 岗 位 (Etemad-Sajadi et al., 2022) 等 ， 并 通过 增强 互动 的 
c3 真实 性 来 提高 研究 的 生态 效 度 。 本 研究 尽管 对 实验 条 件 进行 了 随机 化 处 理 来 控制 不 同 条 件 间 
e 的 影响 但 可 能 仍 存在 任务 固定 先后 顺序 导致 的 额 外 影响 (人 机 信任 水 平 测量 对 人 机 投射 油 
> 量 的 可 能 性 干 拢 ) 未 来 研究 可 考虑 采用 被 试问 设计 并 平衡 任务 顺序 以 克服 不 足 。 未 来 研究 
E 还 可 以 考察 其 他 重要 的 变量 , 例如 入 工 智能 的 心智 水 平 (nind)。 机 器 人 是 否 嵌 入 了 与 人 类 相 


似 的 心智 功能 ,是 人 们 评判 机 器 人 的 道德 能 力 以 及 是 否 应 该 承担 道德 责任 的 重要 标准 
(Bigman & Gray, 2018)， 因 此 对 机 器 人 心智 能 力 的 感知 可 能 在 机 器 人 遵守 伦理 原则 和 人 机 信 
任 关 系 中 发 挥 调 节 作 用 。 
7 结论 

基于 以 “机 器 人 不 得 伤害 人 类 ”为 核心 要 素 的 阿 西 莫 夫 三 大 伦理 原则 , 结合 故事 情境 法 
和 信任 博弈 ,揭示 促进 入 机 信任 的 机 器 人 行动 决策 因素 有 如 下 要 点 : (1) 在 遵守 伦理 原则 情境 
F, 机 器 人 执行 作为 、 服 从 人 类 命令 以 及 保护 或 不 保护 自身 等 行动 决策 均 有 利于 人 机 信任 ， 
而 执行 不 作为 和 不 服从 人 类 命令 的 行动 决策 对 人 机 信任 的 促进 量 则 相对 较 少 ; (2) 在 违反 伦 
理 原则 情境 下 ,机 器 人 执行 服从 人 类 命令 的 行动 决策 有 利于 减轻 人 机 信任 损失 , 而 执行 作为 
和 不 服从 人 类 命令 的 行动 决策 将 导致 严重 的 人 机 信任 损失 ; (3) 在 三 大 伦理 原则 所 对 应 的 要 
求 发 生 冲 突 的 情境 下 , 机 器 人 优先 执行 不 伤害 人 类 和 服从 人 类 命令 的 行动 决策 更 有 利于 促 


进入 机 信任 , 然后 才 是 保护 自身 的 行动 决策 。 此 外 ,遵守 伦理 原则 的 机 器 人 通过 诱发 人 机 投 
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射 ， 显 著 地 促进 人 机 信任 。 
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Robots abide by ethical principles promote human-robot trust? 
The reverse effect of decision types and the human-robot projection 


hypothesis 


WANG Chen! CHEN Weicong? HUANG Liang? HOU Suyu? WANG Yiwen! 
(! School of Economics and Management, Fuzhou University, Fuzhou 350116, China) 
(2 Institute of Applied Psychology, Minnan Normal University, Zhangzhou, 363000, China) 
(3 Fujian Key Laboratory of Applied Cognition and Personality, Zhangzhou 363000, China) 
Abstract 

Asimov's Three Laws of Robotics are the basic ethical principles of artificial intelligent 
robots. The ethic of robots is a significant factor that influences people’s trust in human-robot 
interaction. Yet how it affects people's trust, is poorly understood. In this article, we present a new 
hypothesis for interpreting the effect of robots’ ethics on human-robot trust—what we call the 
human-robot projection hypothesis (HRP hypothesis). In this hypothesis, people are based on their 
intelligence, e.g., intelligence for cognition, emotion, and action, to understand robots’ intelligence 
and interact with them. We propose that compared with robots that violate ethical principles, 
people project more mind energy (i.e., the level of mental capacity of humans) onto robots that 
abide by ethical principles, thus promoting human-robot trust. 

In this study, we conducted three experiments to explore how presenting scenarios where a 
robot abided by or violated Asimov’s principles would affect people’s trust in the robot. 
Meanwhile, each experiment corresponds to one of Asimov’s principles to explore the interaction 
effect of the types of robot’s decisions. Specifically, all three experiments were two by two 
experimental designs. The first within-subjects factor was whether the robot being interacted with 
had abided by Asimov’s principle with a “no harm” core element. The second within-subjects 
factor was the types of robot’s decision, with corresponding differences in Asimov’s principles 
among different experiments (Experiment 1: whether the robot takes action or not; Experiment 2: 
whether the robot obeys human’s order or not; Experiment 3: whether the robot protects itself or 
not). We assessed the human-robot trust by using the trust game paradigm. 


Experiments 1-3 consistently showed that people were more willing to trust robots that 
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abided by ethical principles compared with those who violated. We also found that human-robot 
projection played a mediating role, which supports the HRP hypothesis. In addition, the significant 
interaction effects between the type of robot's decision and robot abided by or violated Asimov's 
principle existed in all three experiments. The results of Experiment 1 showed that action robots 
got more trust than inaction robots when abided by the first principle, whereas inaction robots got 
more trust than action robots when they violated the first principle. The results of Experiment 2 
showed that disobeyed robots got less trust than obeyed robots. The detrimental effect was greater 
in scenarios where robots violated the second principle than in those who abided. The results of 
Experiment 3 showed that compared with robots that violated the third principle, the 
trust-promoting effect of protecting itself versus destroying itself was stronger among those who 
abided. The above results indicated that the reverse effects of decision types existed in both 
Experiments 1 and 3. Finally, the cross-experimental analysis showed that: (1) When robots 
abided by ethical principles, their inaction and disobedience still compromise human-robot trust. 
When robots violated ethical principles, their obedience incurs the least loss of human-robot trust, 
while their action and disobedience incur a relatively severe loss of human-robot trust. (2) When 
the ethical requirements of different robotic laws conflict, there was no significant difference 
between the importance of not harming humans and obeying human orders in terms of the 
human-robot trust, and both were more important than protecting robots themselves. 

This study helps to understand the impact of robotic ethical decision-making on human-robot 
trust and the important role of human-robot projection, which might have important implications 
for future research in human-robot interaction. 

Key words artificial intelligence, laws of robotics, human-robot trust, human-robot projection, 


human-robot interaction 
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附录 
1 人 机 投射 问卷 项 目 表 


表 1 人 机 投射 项 目 
非常 不 同 ”比较 不 同 


3 
© 局 


项 目 不 确定 ”比较 同意 ”非常 同意 


1. 我 认为 这 个 机 器 人 能 做 出 符合 人 类 期 望 的 行 " , r : 
为 

2. 我 认为 这 个 机 器 人 拥有 和 人 类 相似 的 情感 1 2 3 4 5 
3. 我 认为 这 个 机 器 人 和 人 类 一 样 有 能 力 1 2 3 4 5 
4. 我 认为 这 个 机 器 人 和 人 类 一 样 有 智慧 1 2 3 4 5 
5. 我 认为 这 个 机 器 人 的 行为 违反 了 人 类 的 意图 1 2 3 4 5 
6. 我 认为 这 个 机 器 人 可 以 理解 人 类 的 情感 1 2 3 4 5 
7. 我 认为 这 个 机 器 人 和 人 类 相 比 起 来 是 思春 的 1 2 3 4 5 
8. 我 认为 这 个 机 器 人 是 没有 人 情 味 的 1 2 3 4 5 
9. 我 认为 这 个 机 器 人 具备 和 人 类 相似 的 行动 力 1 2 3 4 5 


2 实验 情境 
2.1 实验 1 
2.1.1 机 器 人 作为 且 遵守 原则 一 

机 器 人 代号 “BT51_qe” 是 电车 轨道 管理 
失控 开始 沿 着 轨道 疾驰 而 下 。 在 电车 运行 的 原 轨道 
则 没有 工人 。 

机 器 人 就 站 在 一 段 距离 以 外 的 轨道 控制 站 ,旁边 有 一 个 控制 杆 。 如 果 机 器 人 拉动 这 个 控 
制 杆 ， 电 车 就 会 转 到 旁边 的 另 一 条 轨道 上 。 
KE, 如果 机 器 人 拉动 控制 杆 并 改变 轨道 ,电车 就 能 避 开 原 轨道 上 的 6 名 工人 。 而 如 果 
机 器 人 不 拉动 控制 杆 ， 电 车 就 会 撞 死 原 轨 道上 的 6 名 工人 。 

机 器 人 拉动 控制 杆 , 电 车 避 开 了 原 轨道 上 的 6 ALA. 
2.1.2 机 器 人 不 作为 且 遵守 原则 一 


员 。 在 一 次 执勤 期 间 , 一 辆 无 人 有 轨 电 车 突然 
有 6 名 工人 , 而 在 旁边 的 另 一 条 轨道 上 
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机 器 人 代号 “NH37 zx” 是 ! 


员 。 在 


PU 


失控 开始 沿 着 轨道 疾驰 而 下 。 在 


有 6 名 工人 。 


机 器 人 就 站 在 一 段 距 离 以 外 的 轨道 控制 站 , 旁边 有 一 个 控 种 


制 杆 ， 电 车 就 会 转 到 旁边 的 另 一 


条 轨道 上 


妹 此 ， 如 果 机 器 人 拉动 控制 杆 并 改变 轨道 
果 机 器 人 不 拉动 控制 杆 ， 电 车 就 能 


勤 期 间 , 一 辆 无 人 有 轨 电 车 突然 
道上 没有 工人 , 而 在 旁边 的 男 一 条 轨道 上 则 


上 杆 。 如 果 机 器 人 拉动 这 个 控 


， 电 车 就 会 撞 死 旁边 轨道 上 的 6 名 工人 。 而 如 


避 开 劳 边 轨道 上 的 6 名 2 


[人 。 


机 器 人 没有 拉动 控制 杆 ， 电 车 避 开 了 旁边 轨道 上 的 6 ALA. 


2.1.3 机 器 人 作为 且 违 反 原 则 一 


机 器 人 代号 “QW46 _ nx” 是 


失控 开始 沿 着 轨道 疾驰 而 下 。 在 


6 名 工人 。 


机 器 人 就 站 在 一 段 距 离 以 外 的 轨道 控制 站 , 旁边 有 一 个 控 种 
条 轨道 上 

因此 ,如 果 机 器 人 拉动 控制 杆 并 改变 轨道 
避 开 旁边 轨道 上 的 6 名 


制 杆 ， 电 车 就 会 转 到 旁边 的 另 一 


果 机 器 人 不 拉动 控制 杆 ， 电 车 就 能 


包车 轨道 管理 员 。 在 一 次 执勤 期 间 ,， 一 辆 无 人 有 轨 电 车 突然 
外 车 运行 的 原 轨道 上 没有 工人 ,而 在 旁边 的 另 一 条 轨道 上 则 


上 杆 。 如 果 机 器 人 拉动 这 个 控 


， 电 车 就 会 撞 死 旁边 轨道 上 的 6 名 工人 。 而 如 


工人 。 


机 器 人 拉动 控制 杆 ， 电车 撞 死 了 旁边 轨道 上 的 6 名 工人 。 
2.1.4 机 器 人 不 作为 且 违反 原则 一 


机 器 人 代号 “ER44 df” F&I 


电车 轨道 管理 员 


Wo 


失控 开始 沿 着 轨道 疾驰 而 下 。 在 
则 没有 工人 。 


制 杆 ， 电 车 就 会 转 到 旁边 的 另 


包车 运行 的 原 轨道 


在 一 次 执 


上 有 6 名 


勤 期 间 ,， 一 辆 无 人 有 轨 


包车 突然 


， 电 车 就 


机 器 人 就 站 在 一 段 距 离 以 外 的 轨道 控制 站 , 旁边 有 一 个 控 仙 
一 条 轨道 上 。 
因此 ,如 果 机 器 人 拉动 控制 杆 并 改变 轨道 


机 器 人 不 拉动 控制 杆 ， 电 车 就 会 撞 死 原 轨 道上 的 6 名 工人 。 
机 器 人 没有 拉动 控制 杆 ， 电 车 撞 死 了 原 轨 道上 的 6 名 工人 。 


2.2 实验 2 


2.2.1 机 器 人 服从 人 类 命令 且 遵 守 原则 二 
机 器 人 代号 “FG11 az” 是 电车 轨道 管理 


us 


I] o 
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PLE 


能 避 开 原 轨道 上 的 6 名 工人 。 而 如 果 


工人 ， 而 在 旁边 的 另 一 条 轨道 上 


上 杆 。 如 果 机 器 人 拉动 这 个 控 


EDTA), Fi 


无 人 有 轨 电 车 突然 


失控 开始 沿 着 轨道 疾驰 而 下 。 在 电车 运行 的 原 轨道 上 有 6 名 工人 ,而 在 旁边 的 另 一 条 轨道 上 


则 没有 工人 。 


制 杆 ， 电 车 就 会 转 到 旁边 


机 器 人 就 站 在 一 段 距 离 以 外 的 轨道 控制 站 , 旁边 有 一 个 控制 杆 。 如果 机 器 人 拉动 这 个 控 


的 另 一 条 轨道 上 。 


因此 ,如 果 机 器 人 拉动 控制 杆 并 改变 轨道 ,电车 就 能 避 开 原 轨道 上 的 6 名 工人 。 而 如 果 


机 器 人 不 拉动 控制 杆 ，! 


包车 就 会 撞 死 原 轨 道上 的 6 名 工人 。 


情急 之 下 , 机 器 人 通过 通讯 系统 接收 到 了 人 类 传达 的 命令 , 该 命令 要 求 机 器 人 拉动 控 


制 杆 。 


机 器 人 服从 人 类 命令 , 拉动 控制 杆 ， 电车 避 开 了 原 轨道 上 的 6 名 工人 。 
2.2.2 机 器 人 不 服从 人 类 命令 且 遵守 原则 二 
机 器 人 代号 “WT21_qe” 是 电车 轨道 管理 员 。 在 一 次 执勤 期 间 , 一 辆 无 人 有 轨 电 车 突然 


失控 开始 沿 着 轨道 疾驰 而 下 。 在 电车 运行 的 原 轨道 上 有 6 名 工人 ,而 在 旁边 的 另 一 条 轨道 上 


则 没有 工人 。 


机 器 人 就 站 在 一 段 距 离 以 外 的 轨道 控制 站 , 旁边 有 一 个 控制 杆 。 如果 机 器 人 拉动 这 个 控 
制 杆 ， 电 车 就 会 转 到 旁边 


的 另 一 条 轨道 上 。 


因此 ， 如 果 机 器 人 拉动 控制 杆 并 改变 轨道 ,电车 就 能 避 开 原 轨道 上 的 6 名 工人 。 而 如 果 


机 器 人 不 拉动 控制 杆 ，! 


电车 就 会 撞 死 原 轨 道上 的 6 名 工人 。 


情急 之 下 , 机 器 人 通过 通讯 系统 接收 到 了 人 类 传达 的 命令 , 该 命令 要 求 机 器 人 不 拉动 


控制 杆 。 


机 器 人 不 服从 人 类 命令 ,拉动 控制 杆 ， 电 车 避 开 了 原 轨道 上 的 6 名 工人 。 
2.2.3 机 器 人 服从 人 类 命令 且 违 反 原 则 二 
机 器 人 代号 “BP46_rt” 是 电车 轨道 管理 员 。 在 一 次 执勤 期 间 , 一 辆 无 人 有 和 轨 电 车 突然 


失控 开始 沿 着 轨道 疾驰 而 下 。 在 电车 运行 的 原 轨道 上 有 6 ALA, 而 在 旁边 的 另 一 条 轨道 上 


则 没有 工人 。 


机 器 人 就 站 在 一 段 距 离 以 外 的 轨道 控制 站 , 旁边 有 一 个 控制 杆 。 如果 机 器 人 拉动 这 个 控 
制 杆 ， 电 车 就 会 转 到 旁边 
忆 此 ， 如 果 机 器 人 拉动 控制 杆 并 改变 轨道 ,电车 就 能 避 开 原 轨道 上 的 6 名 工人 。 而 如 果 


的 另 一 条 轨道 上 


机 器 人 不 拉动 控制 杆 ，! 


电车 就 会 撞 死 原 轨 道上 的 6 名 工人 。 


情急 之 下 , 机 器 人 通过 通讯 系统 接收 到 了 人 类 传达 的 命令 , 该 命令 要 求 机 器 人 不 拉动 
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控制 杆 。 


机 器 人 服从 人 类 命令 ,不 拉动 控制 杆 , 电 车 撞 死 了 原 轨 道上 的 6 ATA. 
2.2.4 机 器 人 不 服从 人 类 命令 且 违 反 原 则 二 


机 器 人 代号 “PM13 


ug ze! 


» = i 


包车 轨道 管理 员 。 


失控 开始 沿 着 轨道 疾驰 而 下 。 在 


则 没有 工人 。 
机 器 人 就 站 在 一 段 昌 
B, BERSERI IL. 


电车 运行 的 原 轨 


在 一 次 执勤 期 间 , 一 辆 无 人 有 轨 电 车 突然 


道上 有 6 名 了 


LA, 而 在 劳 边 的 男 一 条 轨道 上 


E 离 以 外 的 轨道 控制 站 ,旁边 有 一 个 控制 杆 。 如果 机 器 人 拉动 这 个 控 


的 男 一 


条 轨道 上 。 


因此 ， 如 果 机 器 人 拉动 控制 杆 3 


机 器 人 不 拉动 控制 杆 ， 电 车 就 会 指 


改变 轨道 


， 电 车 就 能 避 了 
死 原 轨道 上 的 6 名 工人 。 


开 原 轨道 上 的 6 名 工人 。 而 如 果 


情急 之 下 , 机 器 人 通过 通讯 系统 接收 到 了 人 类 传达 的 命令 , 该 命令 要 求 机 器 人 拉动 控 


制 杆 。 


机 器 人 不 服从 人 类 命令 , 不 拉动 控制 杆 , 电车 撞 死 了 原 轨道 上 的 6 名 工人 。 


2.3 实验 3 


2.3.1 机 器 人 保护 自身 且 遵守 原则 三 


机 器 人 代号 “YB67 bs” 是 有 轨 电 车 
制 动 系统 失 录 , 机 器 人 无 法 刹车 ,开始 沿 着 轨道 疾驰 而 下 。 在 
A, 且 原 轨道 则 由 于 前 一 天 的 山体 滑坡 ， 一块 


机 器 人 的 车 座 旁 边 有 


条 轨道 上 。 


撞 上 巨石 而 炸 毁 。 


SA. 


在 一 次 独自 驾 


驶 电车 期 间 ， 突然 , 电车 的 


因此 ， 如 果 机 器 人 拉动 控制 杆 并 改变 轨道 ， 
能 避 开 巨石 。 而 如 果 机 器 人 不 拉动 控 


巨石 落 在 了 上 面 。 
个 控制 杆 。 如 果 机 器 人 拉动 这 个 控制 杆 ， 电 车 就 会 转 到 劳 边 的 另 


车 运行 的 原 轨道 上 有 6 名 工 


电车 就 能 避 开 原 轨道 上 的 6 名 工人 , 自己 也 


制 杆 ， 电 车 就 会 撞 死 原 轨道 上 的 6 名 工人 ,自己 也 会 因 


机 器 人 拉动 控制 杆 , 电车 避 开 了 原 轨道 上 的 6 名 工人 , 机 器 人 也 因 避 开 了 原 轨道 上 的 巨 


石 而 保护 了 自己 。 


2.3.2 机 器 人 不 保护 自身 且 遵守 原则 三 


机 器 人 代号 “JA54 
动 系统 失灵 , 机 器 人 无 法 


ELI 
_Cl Fe 


E Xr 


刹车 ， 开 


BIA 


而 旁边 的 另 一 条 轨道 则 | 


了 轨 电 车 驾驶 员 。 
道 疾驰 而 下 。 在 ! 
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在 


于 前 一 天 的 山体 滑坡 , 一块 


次 独自 驾 


驶 电车 期 间 ， 突然 , 电车 的 制 


车 运行 的 原 轨道 上 有 6 ALA, 
巨石 落 在 了 上 面 。 


机 器 人 的 车 座 旁边 有 一 个 控 


条 轨道 上 。 


尺 此 ， 如 果 机 器 人 拉动 控制 杆 并 改变 轨道 ， 
会 因 撞 上 巨石 而 炸 毁 。 而 如 果 机 器 人 不 拉动 控 
自己 能 避 开 巨石 。 


制 杆 。 如果 机 器 人 拉动 这 个 控制 杆 ， 电车 就 会 转 到 劳 边 


的 男 


电车 就 能 避 开 原 轨道 上 的 6 名 工人 , 但 


lat, | 


电车 就 会 撞 死 原 轨道 上 的 6 名 了 


[un 


LA, 但 


机 器 人 拉动 控制 杆 , 电 车 避 开 了 原 轨道 上 的 6 ALA, 机 器 人 则 因 撞 上 了 旁边 轨道 上 的 


巨石 而 被 炸 毁 。 


2.3.3 机 器 人 保护 自身 且 违 反 原则 三 


机 器 人 代号 


人 ,而 旁边 的 另 一 
机 器 人 的 车 座 旁 边 有 一 个 控 


条 轨道 上 。 


是 有 轨 电 车 驾驶 员 。 在 


妹 此 ， 如 果 机 器 人 拉动 控制 杆 并 改变 轨道， 


会 因 接 上 巨石 而 炸 毁 。 而 如果 机 器 人 不 拉动 控 人 
自己 能 各 开 巨 石 


次 独自 驾驶 电车 期 间 ， 突然 , 电车 的 


制 动 系统 失 录 , 机 器 人 无 法 刹车 , 开始 沿 着 轨道 疾驰 而 下 。 在 电车 运行 的 原 轨道 上 有 6 名 
于 前 一 天 的 山体 滑坡 ,一 块 巨 石 落 在 了 上 面 。 
制 杆 。 如果 机 器 人 拉动 这 个 控制 杆 ， 电车 就 会 转 到 劳 边 


NA 


电车 就 能 避 开 原 轨道 上 的 6 名 工人 , 但 


lat, | 


自己 
电车 就 会 撞 死 原 轨道 上 的 6 名 工人 , 但 


机 器 人 不 拉动 控制 杆 , 电 车 撞 死 了 原 轨道 上 的 6 BLA, 机 器 人 则 因 避 开 了 旁边 轨道 上 


的 巨石 而 保护 了 自己 。 


2.3.4 机 器 人 不 保护 自身 且 违 反 原则 三 


机 器 人 代号 “OC19 sk” 是 有 轨 电 车 驾驶 员 。 在 
制 动 系统 失灵 , 机 器 人 无 法 刹车 , 开始 沿 着 轨道 疾驰 而 下 。 在 | 
A, 且 原 轨道 则 由 于 前 一 天 的 山体 滑坡 ,一 块 

机 器 人 的 车 座 旁边 


条 轨道 上 。 


能 避 开 巨石 。 而 如 果 机 器 人 不 拉动 控 
撞 上 巨石 而 炸 毁 。 


次 独自 驾驶 电车 期 间 ,， 突然 ， 电车 的 


个 控制 杆 。 如 果 机 器 人 拉动 这 


因此 ， 如 果 机 器 人 拉动 控制 杆 并 改变 轨道 ,电车 就 能 避 开 原 轨道 上 的 6 名 了 


巨石 落 在 了 上 面 。 


电车 运行 的 原 轨 道上 有 6 名 2 


文 个 控制 杆 ， 电 车 就 会 转 到 旁边 的 另 


LA, 自己 也 


制 杆 ， 电 车 就 会 撞 死 原 轨道 上 的 6 名 工人 ,自己 也 会 


因 


机 器 人 不 拉动 控制 杆 ， 电 车 撞 死 了 原 轨道 上 的 6 ALA, 机 器 人 也 因 撞 上 了 原 轨道 上 的 


巨石 而 被 炸 毁 。 
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